首页
资讯
数码
智能车
智库
活动
MEET大会
AIGC
扫码关注量子位
刷榜
大模型竞技场再被锤!Llama4私下测试27个版本,只取最佳成绩
“竞技场不应该是唯一基准参考”
明敏
2025-05-02
刷榜
大模型竞技场
别让大模型被基准评估坑了!测试集乱入预训练,分数虚高,模型变傻
来自人民大学等最新研究
明敏
2023-11-09
benchmark
刷榜
大语言模型
加载更多
热门文章
Manus卖给了Meta!年初火爆年底数十亿美元被收购
2025-12-30
华为云CEO周跃峰:要避免AI成为“泡沫” 必须要提升行业生产力
2025-12-30
真如摄影、细至发丝!阿里开源新一代图像生成模型Qwen-Image
2025-12-31
对科技圈,小红书是个「新绿洲」
2025-12-30
吴恩达年度AI总结来了!附带一份软件开发学习小tips
2025-12-31