美团LongCat团队发布VitaBench智能评测基准并开源
10月20日,美团LongCat团队发布高度贴近真实生活场景的VitaBench智能体评测基准,以外卖点餐等三大场景为载体,构建66个工具的交互式评测环境,并已全面开源。...
美团LongCat团队发布LongCat-Flash-Thinking高效推理模型
9月22日,美团LongCat团队发布全新高效推理模型LongCat-Flash-Thinking,具备深度思考与工具调用能力,已在HuggingFace、Github全面开源。...


