奖励模型

只因一个“:”,大模型全军覆没

LLM会被表面内容操纵,产生假阳性结果

鹭羽 2025-07-15

首个奖励模型评分基准!清华复旦港科大联合攻克AI评委“偏科”

评估奖励模型区分微妙变化和抵抗风格偏差的能力