首页
资讯
智能车
智库
活动
MEET大会
AIGC
扫码关注量子位
刷榜
大模型竞技场再被锤!Llama4私下测试27个版本,只取最佳成绩
“竞技场不应该是唯一基准参考”
明敏
2025-05-02
刷榜
大模型竞技场
别让大模型被基准评估坑了!测试集乱入预训练,分数虚高,模型变傻
来自人民大学等最新研究
明敏
2023-11-09
benchmark
刷榜
大语言模型
加载更多
热门文章
硬刚GPT-Image-2!国产AI生图“天花板”又被捅破了?
2026-04-25
刚刚,GPT-5.5发布!内测英伟达工程师:失去它像被截肢
2026-04-24
前小鹏汽车自动驾驶一号位李力耘出任众擎CTO,加速打造具身大脑
2026-04-21
河南师傅,左手扳手,右手飞书,竟然能搞数据分析!
2026-04-23
物理优先+VLA闭环进化:高德ABot-World世界模型,破解具身智能零样本泛化难题
2026-04-21