首页
资讯
数码
智能车
智库
活动
MEET大会
AIGC
扫码关注量子位
benchmark
别让大模型被基准评估坑了!测试集乱入预训练,分数虚高,模型变傻
来自人民大学等最新研究
明敏
2023-11-09
benchmark
刷榜
大语言模型
加载更多
热门文章
用杏鲍菇控制机器人运动!康奈尔等新研究登Science子刊
2024-09-09
AMD放弃旗舰游戏显卡,专注AI,新统一架构挑战英伟达CUDA生态
2024-09-10
顶配性能极致体验 1999元起越级清洁旗舰石头洗地机A30系列发布
2024-09-09
马斯克明确火星时间表:2年星舰起飞,4年载人飞行,20年殖民地
2024-09-09
通用端到端OCR模型开源,拒绝多模态大模型降维打击
2024-09-10