海外评测DeepSeek-V4:智能体任务排名开源第一 幻觉率上升 Token消耗大
4月24日,DeepSeek-V4预览版正式发布并同步开源,号称在Agent能力、世界知识与推理性能三大维度达到国内及开源领域领先水平。
DeepSeek-V4分为Pro与Flash两个版本,均支持百万(1M)token超长上下文。
两个版本均...OpenAI发布Images 2 获机构Arena.ai测评第一
今天凌晨,OpenAI CEO 奥尔特曼带队开启了一场20多分钟的线上直播,直播中提到Images 2是公司迄今为止功能最强大的图像生成模型。从评测基准来看,Images 2确实表现出色。海外大模型评测机构Arena.ai发布帖子表示,OpenA...
Xiaomi miclaw通过首批中国信通院可信AI手机端智能助手评测
4月17日消息,中国信息通信研究院近日开启手机端智能助手(Claw)的评估,Xiaomi miclaw成为国内首批通过该评测的手机端智能体。
(文章来源:界面新闻)...AI视频生成模型HappyHorse-1.0强势登顶.
一款名为HappyHorse-1.0的视频生成模型在Artificial Analysis的榜单上表现抢眼,超越多个明星产品,成为文本转视频和图像转视频类榜首。该模型在画面一致性、细节还原度和运动自然度方面表现出色,标志着视频生成技术的进一步优化和成熟。...
AI视频生成模型HappyHorse-1.0强势登顶.
一款名为HappyHorse-1.0的视频生成模型在Artificial Analysis的榜单上表现抢眼,超越多个明星产品,成为文本转视频和图像转视频类榜首。该模型在画面一致性、细节还原度和运动自然度方面表现出色,标志着视频生成技术的进一步优化和成熟。...
AI视频生成模型HappyHorse-1.0强势登顶
一款名为HappyHorse-1.0的视频生成模型在Artificial Analysis的榜单上表现抢眼,超越多个明星产品,成为文本转视频和图像转视频类榜首。该模型在画面一致性、细节还原度和运动自然度方面表现出色,标志着视频生成技术的进一步优化和成熟。...
快手Agentic Coding模型升级 测评成绩优异
近日,快手Agentic Coding模型KAT-Coder-Pro V1在官方评测中以64分超越其他模型,综合模型能力入围总榜Top10,实现了价格与性能的平衡。...
一周热门文章
最新文章
- 金石资源:部分矿山暂时停止作业及开展自查 将对近期经营和财务数据产生一定影响.
- 【早知道】全国首个绿色算力全栈AI平台上线;新一轮深化国资国企改革方案已下发.
- 金石资源:部分矿山暂时停止作业及开展自查 将对近期经营和财务数据产生一定影响.
- 利好来袭!刚刚,上海重磅发布!
- 金石资源:部分矿山暂时停止作业及开展自查 将对近期经营和财务数据产生一定影响.
- 73天!宇树科技科创板IPO过会 A股人形机器人第一股将至
- “算力金属”价格暴涨 新需求强势崛起 锡产业加速技术迭代
- 债市公告精选 | 泰禾集团作为被告涉及三起重大诉讼;富力地产逾期有息债务本金合计426亿元.
- 新动能加速扩张 建筑业景气度回升 5月制造业整体运行稳定
- 俄方称扎波罗热地区大面积断电



