首页
资讯
数码
智能车
智库
活动
MEET大会
AIGC
扫码关注量子位
刷榜
别让大模型被基准评估坑了!测试集乱入预训练,分数虚高,模型变傻
来自人民大学等最新研究
明敏
2023-11-09
benchmark
刷榜
大语言模型
加载更多
热门文章
突发!谷歌发布史上最强大模型Gemini,打爆GPT-4
2023-12-07
马斯克的Grok大模型能玩了!嘴跟他本人一样损
2023-12-08
微软仅凭「提示工程」让GPT-4成医学专家!超过一众高度微调模型,专业测试准确率首次超90%
2023-12-04
“离谱的AI扩图”火了!张张那叫一个出其不意
2023-12-05
突破分辨率极限,字节联合中科大提出多模态文档大模型
2023-12-04