首页
资讯
智能车
智库
活动
MEET大会
AIGC
扫码关注量子位
刷榜
大模型竞技场再被锤!Llama4私下测试27个版本,只取最佳成绩
“竞技场不应该是唯一基准参考”
明敏
2025-05-02
刷榜
大模型竞技场
别让大模型被基准评估坑了!测试集乱入预训练,分数虚高,模型变傻
来自人民大学等最新研究
明敏
2023-11-09
benchmark
刷榜
大语言模型
加载更多
热门文章
太初元碁:40+大模型即发即适配,上线即可用,国产算力高效落地
2026-02-19
懂人性更懂执行,蚂蚁这个万亿开源模型把情商和Agent战斗力都给拉满了
2026-02-19
从舞台秀到真干活,北京卫视春晚演绎机器人走向日常好用
2026-02-19
AMD英伟达都投了!李飞飞创业公司官宣10亿新融资
2026-02-19
谷歌突发Gemini 3.1 Pro!首次采用「.1」版本号,推理性能×2的那种
2026-02-20