AI说话“前言不搭后语”？用逻辑规则教它们读懂文章丨字节AI Lab

萧箫 2021-12-10 15:16:56 来源：量子位

教AI读懂整篇文章

萧箫发自凹非寺
量子位报道 | 公众号 QbitAI

老觉得AI和你说话前言不搭后语？

为了避免AI出现这样的情况，通常我们在NLP中会用到关系抽取技术，用于从非结构化的文本中抽取出结构化的知识，即所谓的关系三元组。

例如这句话：

英国的哈里王子与他美国的同伴梅根订婚了。

△句子级别的关系抽取示例

可以从中抽取2个关系三元组：

1、哈里、皇室成员、英国

2、哈里，订婚于，梅根

目前，句子级别的关系抽取已经比较成熟，但文档级别或是篇章级别的关系抽取却要更难。

不少AI，往往没办法从整篇文章中熟练地提取上下文信息。

△文档级别的关系抽取示例

为此，字节跳动AI-Lab提出了一个文档级的关系抽取框架LogiRE，专门来解决这种“长难篇章”的信息理解挑战。

一起来看看。

此前方法的局限性

此前，大部分关系抽取的方法，通常可以被分为两类：“基于序列”或“基于图”。

其中，基于序列的工作一般借助预训练语言模型，得到每个词的表示，接着使用各种池化的方法得到实体对的表示，再基于这样的表示做关系分类。

基于图的工作，则依赖于一个显示的图结构，通过构建一个图来连接文档中的实体提及，实体以及句子等，之后再利用图神经网络，在这些图上进行消息传递，抽取特征并进行分类。

然而，这两类方法都存在一些局限性。

一方面，序列模型在处理长距离依赖时会遇到困难，基于图的模型虽然一定程度上缓解了这一问题，但图的构建却需要人工确定的规则先验，并且只包含一些粗粒度的信息。

另一方面，他们都只能隐式地通过共享的特征抽取来实现对实体关系之间交互的建模。

在这种情况下，字节AI Lab的研究人员想到了一个新方法：逻辑规则。

用“逻辑规则”来做关系抽取

这个新提出的框架名叫LogiRE，结合逻辑规则与深度神经网络进行文档级关系抽取，核心是作为隐变量的逻辑规则。

其中，逻辑规则连接了框架中的两大构成单元：规则生成器 (Rule Generator) 和关系抽取器 (Relation Extractor)。整个框架的优化，采用的是迭代式的EM算法。

具体来说，逻辑规则被形式化地定义成这样：

对应到关系抽取中，关系对应规则中的“谓词”，实体对应“变量”。

对于基于生成规则的关系抽取，当定义规则对应的分数为确定头实体和尾实体后，在不同的中间实体选择下最高路径得分。

其中，每一条实例化路径的分数，由路径上每一个三元组分数的乘积确定。

三元组的分数可以由任意的关系抽取backbone模型给出。规则组中所有分数，在经过基于sigmoid的逻辑融合之后，即得到对目标三元组的最终概率得分。

实验结果表明，LogiRE无论是在关系抽取的性能 (ign F1，F1) ，还是逻辑自洽性 (logic) 上都超过基线。

随着依赖更长，LogiRE对比基线模型的提升也更明显，表明它对捕获长距离依赖确实更具备优势。

此外，逻辑规则的存在，也使得长距离依赖从词级别简化到实体概念级别，又降低了长距离语义建模的难度。

感兴趣的小伙伴，可以戳下方论文地址获取~

论文地址：
https://aclanthology.org/2021.emnlp-main.95.pdf

项目地址：
https://github.com/rudongyu/LogiRE

NLP 人工智能关系抽取

萧箫

AI说话“前言不搭后语”？用逻辑规则教它们读懂文章丨字节AI Lab

此前方法的局限性

用“逻辑规则”来做关系抽取

相关阅读

Text-to-3D！建筑学小哥自称编程菜鸟，攒了个AI作画三维版，还是彩色的

AIGC创业公司还没盈利，微软Adobe已赚得盆满钵满

又是加拿大！连年拒签NeurIPS参会者被指太荒唐，Hinton亲自过问也没辙

赛事报名 | 2023中关村科学城科创大赛正式启动一图了解如何报名

商汤最新论文登上ICLR 2022：给注意力机制Softmax找个“平替”

2040张图片训练出的ViT，准确率96.7%，连迁移性能都令人惊讶 | 南京大学

热门文章

起底“豆包手机”：核心技术探索早已开源，GUI Agent布局近两年，“全球首款真正的AI手机”

共推空天领域智能化升级！趋境科技与金航数码强强联手

乐奇Rokid这一年，一路狂飙不回头

Waymo数据意外曝光：2500台车每周45万订单，重返全球第一

九章云极独揽量子位三项大奖：以“一度算力”重构AI基础设施云格局

AI说话“前言不搭后语”？用逻辑规则教它们读懂文章丨字节AI Lab

此前方法的局限性

用“逻辑规则”来做关系抽取

相关阅读

Text-to-3D！建筑学小哥自称编程菜鸟，攒了个AI作画三维版，还是彩色的

AIGC创业公司还没盈利，微软Adobe已赚得盆满钵满

又是加拿大！连年拒签NeurIPS参会者被指太荒唐，Hinton亲自过问也没辙

赛事报名 | 2023中关村科学城科创大赛正式启动 一图了解如何报名

商汤最新论文登上ICLR 2022：给注意力机制Softmax找个“平替”

2040张图片训练出的ViT，准确率96.7%，连迁移性能都令人惊讶 | 南京大学

热门文章

起底“豆包手机”：核心技术探索早已开源，GUI Agent布局近两年，“全球首款真正的AI手机”

共推空天领域智能化升级！趋境科技与金航数码强强联手

乐奇Rokid这一年，一路狂飙不回头

Waymo数据意外曝光：2500台车每周45万订单，重返全球第一

九章云极独揽量子位三项大奖：以“一度算力”重构AI基础设施云格局

赛事报名 | 2023中关村科学城科创大赛正式启动一图了解如何报名