首页
资讯
数码
智能车
智库
活动
MEET大会
AIGC
扫码关注量子位
benchmark
别让大模型被基准评估坑了!测试集乱入预训练,分数虚高,模型变傻
来自人民大学等最新研究
明敏
2023-11-09
benchmark
刷榜
大语言模型
加载更多
热门文章
材料界AlphaFold来了!微软AI模型登上Nature,还和中国团队合作发现新材料
2025-01-17
首个国产版AlphaFold3发布!大分子预测精度超车,在线平台即开即用,推理成本更是白菜价
2025-01-17
5090跑《黑神话》飙到200+帧,英伟达DLSS也用上Transformer了
2025-01-17
除了L2升维和直奔L4,自动驾驶还能这样实现…
2025-01-17
宇树机器人上演弯道超车(ren),歪果仁质疑是特效
2025-01-17