优秀财经网 优秀的人都在用的资讯工具

全球指数

首页 > TAG信息列表 > 合规表现
  • MiniMax开源首个面向 Coding Agent 的系统性评测集

    MiniMax正式开源首个面向 Coding Agent 的系统性评测集OctoCodingBench,评测结果显示部分开源模型在过程合规指标上已快速逼近甚至超越部分闭源模型,反映出在 Agent 时代,“数据与评测范式”的重要性正在上升为新的竞争要素。...

    2026-01-14