首页
资讯
智能车
智库
活动
MEET大会
AIGC
扫码关注量子位
奖励模型
只因一个“:”,大模型全军覆没
LLM会被表面内容操纵,产生假阳性结果
鹭羽
2025-07-15
LLM
奖励模型
首个奖励模型评分基准!清华复旦港科大联合攻克AI评委“偏科”
评估奖励模型区分微妙变化和抵抗风格偏差的能力
鹭羽
2025-05-13
LLM
基准测试
奖励模型
加载更多
热门文章
全国首批!商汤大装置SenseCore获软件供应链安全能力评估证书
2026-02-14
「斯坦福AI小镇」创业即获投1亿美元!李飞飞卡帕西都投了
2026-02-14
情人节最硬核“Kiss”!中国AI突破300年亲吻数难题,连刷多维度纪录
2026-02-14
人形机器人放无人机,还能上天入海!有点过于赛博了吧
2026-02-14
GLM-5真够顶的:超24小时自己跑代码,700次工具调用、800次切上下文!
2026-02-14