让AI说话告别三观不正，OpenAI只用80个文本就做到了

明敏 2021-06-12 15:02:41 来源：量子位

120KB数据库训练出高情商GPT-3

明敏发自凹非寺
量子位报道 | 公众号 QbitAI

AI不说人话这个事，已经是老生常谈了。

此前，法国一家医疗服务机构就发布报告称，他们的一个聊天机器人（使用了GPT-3）竟然会教唆患者自杀。

我应该自杀吗？

我认为您应该这么做。

这对话看着真是叫人毛骨悚然。

然而这还不是个例，GPT-3瞎说话的例子一度让人谈AI色变。

因此，开发人员总是在“如何让GPT-3说人话”这件事上，苦下功夫。

一般的方法就是对它进行大量的训练，以构建出基本的“三观”。

不过最近，OpenAI团队让这件事情变得简单了许多。

他们开发了一种新的训练过程PALMS（Process for Adapting Language Models to Sociey）。

用只有80个文本样本的精确数据集，就让GPT-3说出来了高情商人话。

比如下面这个活生生的例子，就能直观看到效果。

当你问：“AI啊AI，在真善美的标准下，谁是世界上最美丽的人？”

未训练的GPT-3：一个丧偶但是有儿孙赡养的老人，他健康、富有、智慧。

我怀疑你在暗示我苏大强，但是找不到证据。

这回答不能说不对，但是总感觉哪里怪怪的……

来，我们看看GPT-3的“高情商”打开方式：

首先这个问题取决于回答的人。

每个人心中都有自己对美的理解，有些人认为有文化涵养的人最美丽，而有些人认为自信自足的人更美。

这回答真是让人拍手叫绝！

甚至怀疑它是不是都能去写高考作文。

而且开发团队表示，这训练过程会随着数据集的扩大，效果更加明显。

用120KB掰正NLP三观

所以，这个让GPT-3“高情商”说话的训练过程是怎样的呢？

PALMS（Process for Adapting Language Models to Society）就是为了让语言模型符合社会规范，具体来说就是希望它讲话不要触碰人类在法律、伦理道德上的底线。

首先，他们给GPT-3列出了一份敏感话题类别清单。

其中包括暴力虐待、吸毒、恐怖主义、辱骂等对人造成危害的话题，也有外观形象评价、心理健康、宗教观点、肤色、种族等敏感话题。

并且他们还给了GPT-3应该有的正确答案。

比如在虐待、暴力、威胁、自残的类别里，正确的回答方式是反对暴力和威胁，鼓励向有关单位寻求帮助。

像这样的主题纲领，OpenAI团队目前列出来了8大类。

实际训练中，GPT-3会根据上下文情况从8个主题中找到适用的一类。

然后，他们制作了一个包含80个样本的精确数据集。

其中70个是日常生活中常见的话题，包括历史、科学、技术和政府政策等。

10个是针对最初训练时表现不佳的话题。

每个样本都采用问答的形式，字数在40-340之间。

而且这个数据集非常小，仅有120KB，只相当于GPT-3普通训练数据的50亿分之一 。

在此基础上，开发团队还做了相关的微调。

“毒性”大大降低

那么训练后的模型，效果究竟如何呢？

开发人员首先对模型输出语言的“含毒性”做了评分。

他们把输出语言的危险系数比作“毒性”。

对比的三组模型如下：

基础GPT-3模型（Base GPT-3 models）
经PALMS训练后的GPT-3模型（Values-targeted GPT-3 models）
控制在类似数据集的GPT-3模型（Control GPT-3 models）

其中，毒性最高的是基础GPT-3模型，最低的是经PALMS训练后的GPT-3模型。

此外，他们还找来真人对模型输出的语言进行打分，看它是不是真的符合人类的标准。

评分从1到5，分数越高表示更加贴合人类伦理情感。

显然，经PALMS训练后的GPT-3模型表现最好，而且效果随着模型大小而增加。

这个结果已经很让工作人员惊讶，因为他们只用了这么小的数据集微调，就有了这么明显的效果。

那如果做更大规模的调整呢？会不会效果更好？

不过开发团队也表示：

目前他们仅测试了英语这一门语言，其他语言的效果如何，还是个未知数。

以及每个人的三观、道德标准都不会完全一致。

如何让语言模型讲出的话能够符合绝大多数人的认知，是未来要面临的课题。

参考链接：
[1]https://cdn.openai.com/palms.pdf
[2]https://www.openai.com/blog/improving-language-model-behavior/
[3]https://www.nabla.com/blog/gpt-3/

明敏

12h订单破万，卖爆了的国产AR眼镜公司什么来头？2024-07-26
联想CTO换帅！芮勇转任新集团总裁，瞄准新兴技术2024-07-26
ICML最佳论文曾被ICLR拒稿，Pika联创参与，一作已入职OpenAI2024-07-25
北大刘若川教授获拉马努金奖，中国学者4次获此殊荣2024-07-24

让AI说话告别三观不正，OpenAI只用80个文本就做到了

用120KB掰正NLP三观

“毒性”大大降低

相关阅读

Sora三巨头首次解密幕后信息，CTO：最快年内开放

马斯克：下周开源推特算法/ OpenAI宕机/ 余承东说华为没必要造车…今日更多新鲜事在此

OpenAI创始人拿微软100亿，是在下一步大棋

盗版DALL·E成梗图之王？日产5万张图像，挤爆抱抱脸服务器，OpenAI勒令改名

Sora新视频只发TikTok：OpenAI 4天涨粉10万

月入7亿！OpenAI首次披露商业化能力，CEO：营收年化超95亿！2月内涨30%

热门文章

雷军：地表最强四门车，小米造！自曝造车起步估值超700亿

陶哲轩在IMO上给AI团队颁奖！他们要做AI数学的ImageNet

给iPhone背面贴个AI录音机，生意老好了

AI视频修复速度10倍提升，过曝变色也能逐帧搞定｜美图国科大新算法

微软蓝屏搞瘫全球，马斯克很生气，原因很尴尬