首页
资讯
智能车
智库
活动
MEET大会
AIGC
扫码关注量子位
benchmark
o3-pro通关“推箱子”,人类怀旧小游戏成了大模型新Benchmark
测评负责人还是大模型竞技场顾问
克雷西
2025-06-17
benchmark
别让大模型被基准评估坑了!测试集乱入预训练,分数虚高,模型变傻
来自人民大学等最新研究
明敏
2023-11-09
benchmark
刷榜
大语言模型
加载更多
热门文章
技术获 NVIDIA、Pi 双重认可!原力灵机 DM0 模型重塑具身智能新范式
2026-03-06
高德发布全球首个由大模型驱动的视觉认知步行导引系统
2026-03-06
Transformer作者重造龙虾,Rust搓出钢铁版,告别OpenClaw裸奔
2026-03-06
彻底告别VE与VAE!商汤硬核重构多模态:砍掉所有中间编码器
2026-03-07
2026年,AI初创全球化的「变与不变」|沙龙招募
2026-03-06