红杉中国发布AI基准测试工具xbench,引领AI投资新变革
红杉中国推出全新AI基准测试工具xbench,旨在解决现有基准测试难以真实反映AI能力的问题。该工具采用双轨评估体系,包含科学问题解答与中文互联网深度搜索两个核心评估集。此举凸显投资机构全面拥抱AI的决心,为AI投资领域带来新变革。...
红杉中国推出全新AI基准测试工具xbench
红杉中国推出全新AI基准测试工具xbench,采用双轨评估体系和长青评估机制,旨在解决基准测试难以真实反映AI客观能力的问题。该工具将重点关注多模态模型生成商用水平视频、MCP工具可信度、GUI Agents使用动态更新/未训练应用等方向。...
Manus AI智能体走红引争议,AI应用重心或转向通用助手
3月6日,AI智能体产品Manus走红,引发资本市场关注。自称全球首个通用AI智能体,性能超OpenAI Deep Research。但质疑声认为系营销炒作,真实水平被夸大。同时,AI智能体或成AI发展下里程碑,2025年或迎爆发元年。...



