优秀财经网优秀的人都在用的资讯工具

财经关键词关于我们联系我们

全球指数

首页 > TAG信息列表 > 评测

海外评测DeepSeek-V4：智能体任务排名开源第一幻觉率上升 Token消耗大

　　4月24日，DeepSeek-V4预览版正式发布并同步开源，号称在Agent能力、世界知识与推理性能三大维度达到国内及开源领域领先水平。
　　DeepSeek-V4分为Pro与Flash两个版本，均支持百万（1M）token超长上下文。
　　两个版本均...

2026-04-25
OpenAI发布Images 2 获机构Arena.ai测评第一

　　今天凌晨，OpenAI CEO 奥尔特曼带队开启了一场20多分钟的线上直播，直播中提到Images 2是公司迄今为止功能最强大的图像生成模型。从评测基准来看，Images 2确实表现出色。海外大模型评测机构Arena.ai发布帖子表示，OpenA...

2026-04-22
Xiaomi miclaw通过首批中国信通院可信AI手机端智能助手评测

　　4月17日消息，中国信息通信研究院近日开启手机端智能助手（Claw）的评估，Xiaomi miclaw成为国内首批通过该评测的手机端智能体。
（文章来源：界面新闻）...

2026-04-17
AI视频生成模型HappyHorse-1.0强势登顶.

一款名为HappyHorse-1.0的视频生成模型在Artificial Analysis的榜单上表现抢眼，超越多个明星产品，成为文本转视频和图像转视频类榜首。该模型在画面一致性、细节还原度和运动自然度方面表现出色，标志着视频生成技术的进一步优化和成熟。...

2026-04-09
AI视频生成模型HappyHorse-1.0强势登顶.

一款名为HappyHorse-1.0的视频生成模型在Artificial Analysis的榜单上表现抢眼，超越多个明星产品，成为文本转视频和图像转视频类榜首。该模型在画面一致性、细节还原度和运动自然度方面表现出色，标志着视频生成技术的进一步优化和成熟。...

2026-04-09
AI视频生成模型HappyHorse-1.0强势登顶

一款名为HappyHorse-1.0的视频生成模型在Artificial Analysis的榜单上表现抢眼，超越多个明星产品，成为文本转视频和图像转视频类榜首。该模型在画面一致性、细节还原度和运动自然度方面表现出色，标志着视频生成技术的进一步优化和成熟。...

2026-04-09
快手Agentic Coding模型升级测评成绩优异

近日，快手Agentic Coding模型KAT-Coder-Pro V1在官方评测中以64分超越其他模型，综合模型能力入围总榜Top10，实现了价格与性能的平衡。...

2025-12-16

一周热门文章

最新文章

微信扫一扫