谷歌的最新NLP模型,现在能陪你从诗词歌赋谈到人生哲学

水木番 发自 凹非寺
量子位 报道 | 公众号 QbitAI

继BERT之后,谷歌在NLP模型上又有大动作!

在今天的谷歌I/O大会上,一口气发布了2个新模型:

LaMDAMUM,均基于Transformer架构。

LaMDA(对话应用程序的语言模型),相比BERT的最大优势,是可以自然对话

谷歌的首席执行官桑达尔·皮猜(Sundar Pichai)强调:

专为对话应用而构建的LaMDA模型是开放域的,目的是面对任何话题都能进行交流。不必重新训练模型即可进行其他领域的对话,这一点非常重要。

MUM(多任务统一模型),它的特色是多模态,用谷歌的话就是“比BERT强了1000倍”。

那么,新出炉的两款新语言模型,到底有多强悍?

一起来感受一下。

LaMDA:基于Transformer架构,自然切换话题交流

自然对话是开放式的,可以从一个特定话题开始,到完全不同的话题结束。

就好像:

开头可能与朋友聊的是天气,慢慢聊到这两天大风和下雨会搞乱发型,最后两个人还会乐呵呵地聊起了在村口那家理发店的“托尼老师”剪出的创意发型。

这种曲折的对话总是让聊天机器人犯难,因为机器人通常只能先预设一个比较窄的聊天主题。

但是现在LaMDA就可以做到自由切换主题,解锁了更自然的方式和人进行对话。

在I/O大会的简短演示中,Google展示了LaMDA的实际效果。

其中一大亮点是LaMDA可以“角色扮演”。

例如,有些学生想了解更多有关太空的知识,他们想问LaMDA关于冥王星的问题,LaMDA将会以冥王星的身份进行回答,让学习一下子变得生动有趣了很多。

开聊后,LaMDA显得非常自如,还回答说:

如果要来旅游记得穿得暖和点,因为我这里特别冷。

当被问到“你还希望大家了解你的哪一面”,

它这样回答:

我希望人们知道我不仅仅是一个随机的冰球,我实际上是一个美丽的星球。

对于“有没有人访问过冥王星”的问题,LaMDA也能答出准确的事实。

其实,LaMDA对冥王星在内的数百万个主题都相当了解。

它给人的感觉好像在和一个知识渊博的朋友聊天,虽然聊着聊着不知道跑到哪个话题了,但它总能给你丰富而合理的回答。

实际上,LaMDA的对话技巧已经发展很多年了。

与包括BERT和GPT-3在内的许多最新语言模型一样,它也是基于Transformer架构。

Transformer是Google在2017年发明并开源的神经网络体系架构,它可以读取许多单词或句子来训练模型。

它可以充分理清楚这些词相互之间如何关联,并且预测它认为接下来会出现的词。

LaMDA明显接受了更多在对话方面的训练,在开放式对话方面效果奇佳。

皮猜这样评价LaMDA:

LaMDA在公平性,准确性,安全性和隐私性方面都已经达到了非常高的标准。

目前,虽然LaMDA还没有出现在任何产品中,但谷歌正在继续研究这项技术,最终会将其用于Assistant,Search和Workspace等产品中。

MUM:同时解锁各种信息的“独门武器”

LaMDA是自然对话中的一大进步,但仅适用于文字方面。

当人们彼此交流时,他们会同时使用图片,文本,音频和视频等进行交流。

因此,谷歌今天还发布了他们的MUM模型。

它是一种多语言多模态模型,可以通过执行多任务,解锁各类信息。

Google高级副总裁Prabhakar Raghavan说:

MUM可以一次接受超过75种语言的数据,可以让模型跨语言获得知识,它可以同时理解各种形式的信息,包括文本,图像和视频。

MUM会在不同语言资源里并找到最相关的结果,最终通过用户偏好的语言呈现。

当问它:

“我已经成功登上了亚当斯山,我想在明年秋天去爬富士山,应该做些什么准备?”

由于具有多模态功能,MUM 可以通过用户提供的照片、视频、路线图等信息,针对富士山和亚当斯山的季节、地质等差异,提出最合理的攀登路线、时间和装备建议,比如建议提问者带一件防水外套等。

MUM还会特别贴心地给出一些相关视频或者博客的链接,让提问者有更多深入研究的机会。

当然,所有它的回答都来自网络上的文章,视频和图片。

MUM还可以依靠上下文,以及多类型的信息,比如图像和对话来进行回答。

比如,给它一张鞋子的照片并问“我可以用它来爬富士山吗?”

MUM可以理解图像的内容和分析背后的意图,通过搜索之前的数据让提问者知道鞋子是否是合适的。

Google 2019年推出的BERT经历了很多,MUM也会经历这些模型“从问题到解决”的过程。

比如,研究团队正在寻找表征机器学习中偏见的模态,以避免在MUM中引入偏见。

研究团队还在运用最新研究中的经验来确保MUM的搜索尽可能高效,使它更加强大。

至于目前究竟多强大,正如谷歌官方给出的说法是:

MUM像BERT一样建立在Transformer架构上,但功能却强大了1000倍。

BERT有多强大家都知道,所以是不是瞬间感觉对MUM充满了小期待呢?

网友:居然可以化解矛盾,神了!

谷歌在I/O大会上一发布这两套模型,网友们立刻关注度满满。

一位网友提到:

我注意到GPT-3的陈述经常是矛盾的。我完全相信,可以搞出一个更好的系统,能够更好地化解矛盾,而不是一开始就刻意躲开矛盾。

不谋而合,一位Google员工也提到:

我认为聊天机器人的一个共同缺点是,可以通过提供一些论点或者论据,甚至只是通过提出问题的方式就可以使它们相互矛盾。但是当我尝试使用LaMDA时,我发现LaMDA对矛盾的抵抗力比我预期的要强得多。

这说明谷歌正在努力的方向是:

主动解决自然语言处理中的问题,而不是一味地规避问题。

基于强大的问答交流模型,让机器能像朋友一样和你聊天,并能给出很多实用的答案,这让我们看到了自然语言处理的未来趋势:

不仅能充分提升AI的温度,也能同时处理出各类信息,回归到“以人为本”的初衷上来。

下一步,这两套模型还能再优化吗?

让我们拭目以待!

参考链接

[1]https://9to5google.com/2021/05/18/google-lamda-natural-language/
[2]https://blog.google/products/search/introducing-mum/
[3]https://blog.google/technology/ai/lamda/
[4]https://blog.google/technology/developers/io21-helpful-google/
[5]https://news.ycombinator.com/item?id=27198087
[6]https://zhuanlan.zhihu.com/p/373443775

版权所有,未经授权不得以任何形式转载及使用,违者必究。