首页
资讯
数码
智能车
智库
活动
MEET大会
AIGC
扫码关注量子位
benchmark
o3-pro通关“推箱子”,人类怀旧小游戏成了大模型新Benchmark
测评负责人还是大模型竞技场顾问
克雷西
2025-06-17
benchmark
别让大模型被基准评估坑了!测试集乱入预训练,分数虚高,模型变傻
来自人民大学等最新研究
明敏
2023-11-09
benchmark
刷榜
大语言模型
加载更多
热门文章
真如摄影、细至发丝!阿里开源新一代图像生成模型Qwen-Image
2025-12-31
吴恩达年度AI总结来了!附带一份软件开发学习小tips
2025-12-31
AI终于学会在家“伺候人”!Hey Tuya,我躺了
2025-12-31
MiniMax作价461亿港元募资46亿,1月9日敲钟代码00100
2025-12-31
从“手工艺”到“AI工程化”:解码AI智能渗透的未来之战
2025-12-31