首页
资讯
智能车
智库
活动
MEET大会
AIGC
扫码关注量子位
刷榜
大模型竞技场再被锤!Llama4私下测试27个版本,只取最佳成绩
“竞技场不应该是唯一基准参考”
明敏
2025-05-02
刷榜
大模型竞技场
别让大模型被基准评估坑了!测试集乱入预训练,分数虚高,模型变傻
来自人民大学等最新研究
明敏
2023-11-09
benchmark
刷榜
大语言模型
加载更多
热门文章
刚刚,国产AI自己造了AI,全球首例!
2026-05-26
卡帕西Anthropic最新头衔:技术员工(MTS)
2026-05-26
4nm!比亚迪自研AI芯片来了:制程对齐英伟达,算力拉爆特斯拉
2026-05-29
DeepSeek V4芯模协同背后,国产算力生态开始飞轮加速
2026-05-28
面壁智能「开源周」:一场定义端侧 AI 终局的系统性「亮剑」
2026-05-29