首页
资讯
数码
智能车
智库
活动
MEET大会
AIGC
扫码关注量子位
刷榜
大模型竞技场再被锤!Llama4私下测试27个版本,只取最佳成绩
“竞技场不应该是唯一基准参考”
明敏
2025-05-02
刷榜
大模型竞技场
别让大模型被基准评估坑了!测试集乱入预训练,分数虚高,模型变傻
来自人民大学等最新研究
明敏
2023-11-09
benchmark
刷榜
大语言模型
加载更多
热门文章
跨境电商的疑难杂症,被1688这个AI全包了…
2025-12-07
起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机”
2025-12-09
苹果芯片主管也要跑路!库克被曝出现健康问题
2025-12-07
看完最新国产AI写的公众号文章,我慌了!
2025-12-08
共推空天领域智能化升级!趋境科技与金航数码强强联手
2025-12-09