最新一期权威大模型榜单:豆包1.5、商汤日日新V6并列国内第一
总量为1579道多轮简答题
5月28日,权威大模型测评机构SuperCLUE《中文大模型基准测评2025年5月报告》全新出炉!
豆包1.5·深度思考模型(Doubao-1.5-thinking-pro)和商汤日日新 V6多模态模型(SenseNova-V6 Reasoner)共同摘得金牌,超越Gemini 2.5 Flash Preview,在国内大模型第一梯队领跑。
位居第二梯队的大模型包括DeepSeek-R1、NebulaCoder-V6、Hunyuan-T1以及DeepSeek-V3。

来自SuperCLUE
报告指出,国内外第一梯队大模型在中文领域的通用能力差距正在缩小。在国产大模型中,
Doubao-1.5-thinking-pro-250415、SenseNova V6 Reasoner表现最为亮眼。国内推理模型竞争格局初露端倪。
SuperCLUE是行业权威的通用大模型的综合性测评基准。本次2025年5月报告聚焦通用能力测评,涵盖数学推理、科学推理、代码生成、智能体Agent、精确指令遵循、文本理解与创作六大任务,总量为1579道多轮简答题。
版权所有,未经授权不得以任何形式转载及使用,违者必究。
- 不儿,罗永浩、胡彦斌都来参加这场AI大赛了啊2026-06-16
- 难上热搜的高考数学,我拿ChatGPT和豆包PK了一把!2026-06-08
- 扣子3.0实测:手机就能远程遥控你电脑里的Agent2026-06-04
- 今天起,无限期免费!全球首个全模态API开放,Top 10 AI Lab出手2026-06-01




