AI知识图谱,让我撸到了一只「天山上的雪豹」
用知识图谱让科普活起来
金磊 发自 凹非寺
量子位 报道 | 公众号 QbitAI
云吸猫这个词,最近太火了!
火到有拿「云吸猫」开始变现的,还有用「云吸猫」来写毕业论文的……
喵星人可以说打出了一套「可爱组合拳」,攻占了大片互联网江山。
最近,这种流行趋势似乎有了升级——云撸国家一级保护动物「雪豹」,你敢信?
这是一款由腾讯联合WWF打造、名为「神秘雪豹在哪里」的微信小程序。而且上线2天,便有超过10万人在使用。
打开后便有一只活灵活现的雪豹映入眼帘:
摇晃着小脑袋,无辜的眼神四处打量,还有那柔顺的毛发(爱了爱了,好想舔屏吸上一口)……
咳咳,言归正传。
通过首页下方文字的介绍,了解到雪豹是唯一一种分布在中国的大型猫科动物(大猫),也是分布海拔最高的一种。
点击雪豹身上的四个白色点点,还对其「头部结构」、「毛发」、「整体外形」以及「尾巴」等,都有了非常详尽的了解。
看到这里,让人不禁有了想要更深入了解它的冲动。
在第二个模块便对它的成长过程做详尽的描述,包括「幼崽发育」、「亚成体」、「成年」以及「孕期生产」。
看着雪豹从小小的一只,到长大成年,再到孕育诞生新的小生命,仿佛在短短的几分钟便经历了它的「完整生命过程」。
那它的生存环境如何?是否有天敌?别急,在第三和第四个版块中也有所介绍。
在第三个版块「同域」中,展示了与雪豹相关的同域物种生物链图谱:
点击物种的名称,发亮的连线两端联系着食物链中的猎物与捕食者。 与连接线相同颜色的物种,是链中的捕食者;物种颜色一致,表示是同类物种。
同样,在第四个版块「环境」中,也对雪豹生存的环境做了相应的介绍。
不仅如此,在界面下方的「进化与科学发现」以及「研究和保护」版块,对雪豹的起源、研究做了更深入的介绍。
短短的几分钟时间,通过这样一个小程序,不仅仅是对雪豹这种生物有了非常详尽的科普,更像是伴随着经历了它的「前世今生」。
而在这背后,便是来自腾讯云小微AI知识图谱的硬核技术。
知识图谱的「前世今生」
在体验过「神秘雪豹在哪里」这款小程序之后,一个非常直观的感受就是:
它能够围绕着雪豹这个主体,将与它相关的形形色色的资料,都能非常有序地关联到一起。不仅逻辑清晰,而且还一目了然。
而这就是知识图谱的力量。
那么,知识图谱的能力为什么如此强悍?这就要从它的起源讲起。
知识图谱的概念并不是非常新,其思路可以追溯到上世纪五六十年代的「知识表示形式」——语义网络 (Semantic Network)。
语义网络是由相互连接的「节点」和「边」组成:
- 节点表示概念或者对象。
- 边表示他们之间的关系。
知识图谱和语义网络较为类似,但语义网络更侧重于表示概念与概念之间的关系,而知识图谱更侧重于表示实体之间的关系。
再通俗一点的去说,知识图谱其实就是不断挖掘、建立实体之间的关系,而且这种关系必须是客观现实存在的。
那我们熟知的篮球选手姚明来举个例子。
姚明的「队友」是易建联;他的「妻子」是叶莉……知识图谱便将现实世界中的「队友」和「妻子」等关系,变成语义网络中的「边」,凭借关系连接起姚明、易建联、叶莉等代表着人物实体的「节点」。
当然,除此之外,物理世界中还存在很多隐性或复杂的关系。通过不同关系的挖掘,每一个与姚明相关的实体,都能连接更多实体,整个语义网络便得以成倍延伸,知识图谱也愈发丰富庞大。
总结来看,知识图谱具有以下特点:
- 知识图谱是一种特殊的图数据:是带标记的有向属性图。
- 知识图谱是一种人类可识别且对机器友好的知识表示:采用了人类容易识别的字符串来标识各元素;同时,可以很容易地被计算机识别和处理。
- 知识图谱自带语义、蕴涵逻辑含义和规则:结点对应现实世界中的实体或者概念,每条边或属性也对应现实中的一条知识;可以根据人类定义的规则,推导出知识图谱数据中没有明确给出的知识。
那么回到「神秘雪豹在哪里」,知识图谱是如何具体实现其功能的呢?
腾讯云小微的「AI知识大脑」
能够让这款小程序展现的知识,如此一目了然、深入人心,离不开腾讯云小微AI知识图谱的强大能力。
但其实,这种能力在「神秘雪豹在哪里」的展现知识冰山一角。
以今年腾讯全球数字生态大会中与真人一起同台亮相的「AI助手」那笙为例,便可对其更加了解。
通过视频可以看到,AI助手即便面对「可令怕」这般新型流行词,都能够迅速「猜到」是killing part。
而后再以“夏令营活动”为「中心」,顺着中代表着“可令怕”关系的「边」,找到“回归大自然”、“享受冒险与挑战”、“露营看星星”等「节点」。
就像是赋予了AI助手真正的知识大脑一般。
在这个过程中,体现了腾讯云小微AI知识图谱的三方面能力。
首先,是知识抽取。
知识抽取,是指从半结构/非结构化的文件中,通过自然语言理解(NLP)的技术,能够抽取出:
这段话里所描述的实体是什么?实体的关系是什么?实体的属性是什么?
最后,将抽取出的知识要素,以SPO三元组的形式展现出来。
(注:SPO三元组,即主语-谓语-宾语三元组,是用来表示事物的一种方法和形式。)
腾讯云小微知识图谱平台,支持从丰富的行业数据中抽取出行业信息,助力行业伙伴构建行业专属的知识图谱。
其次,是知识融合。
经历上一个「知识抽取」过程后,实体、关系以及各类属性信息就像是一些杂乱无章的拼图;此外,由于知识的质量不一、来源不同,会存在一些干扰拼图。
在实际应用中,来自各行各业的数据、知识,更是存在这样的问题。
知识融合的作用,就是将这些良莠不齐的知识,分类规整好——将来自不同知识库的同一实体融合在一起。
为了打破各行业间的知识孤岛,腾讯云小微以自有的海量通用知识为中心,通过实体链接、属性融合等多种「知识融合」技术,连接各行业的知识图谱。
最后,是关联多源异构的行业数据。
在经过上述的两个步骤之后,要想实现形成更灵活的知识大脑,还需要经历一个关联的过程。
这全靠腾讯云小微将多源异构的行业数据,诸如不同行业的文件、表格、音频、视频,全链接到「知识图谱」中,从而赋予AI助手更丰富的能力,例如深度问答、主动推荐等。
此外,大规模知识库的构建与应用,还少不了「知识更新」等技术的支持。
……
这便是腾讯云小微AI知识图谱体现的强悍技术硬实力。
而通过这样的技术,让「神秘雪豹在哪里」和「那笙」在科普和AI助手上应用,也不难看出知识图谱所拥有的潜在且广泛的应用价值。
AI知识图谱的价值与未来
进入互联网时代以来,人类世界所产生的数据量呈现爆炸式增长。
如何将海量、异构、动态的大数据,加以表达、组织、管理、利用,是一个急需且必须解决的问题。
知识图谱,便是一种非常有效的方式,可以让网络的智能化水平更高,更加接近于人类的认知思维。
因此,它的应用前景十分的广泛。
例如在智能搜索中,搜索引擎在面对用户输入的查询时,不仅仅是查找关键词这么简单,而是对查询内容做一个语义理解。
而后进行归一化、知识库匹配等一系列操作后,再将结果返回给用户。
在此基础上,更加深入的应用就是语音助手,像苹果Siri、谷歌Assistant等,能够以准确简洁的自然语言为用户提供问题的解答。
在社交网络平台也是如此,例如Facebook在2013年推出的Graph Search,可以通过知识图谱,将人、地点、事件等联系在一起,并在海量的社交网络中,寻找和自己有相关性其他事物。
由此再展开,推荐系统也是知识图谱的应用之一。我们在网购、刷短视频等时,经常遇到的「你可能感兴趣的产品」、「你可能认识的人」,都离不开知识图谱的应用。
更垂直于行业来讲,知识图谱应用于金融、医疗、教育等领域,也可以带来更好的领域知识、更低金融风险等益处。
科技除了要硬核,更应该「向善」
其实,在开头介绍「神秘雪豹在哪里」时,故意留下了一个伏笔,就是小程序顶部的第四个版块——环境。
在这个界面的文字介绍中可以了解到,雪豹所生存的家园,正式支撑着我们每个人日常生活的大江大河的源头。
例如长江、黄河,华夏文明的母亲河;湄公河,东南亚的母亲河;雅鲁藏布江,中国西藏和印度东部的母亲河……
因此,雪豹作为我国一级稀有保护动物,我们去守护的它们的同时,也是在守护着我们自己的家园、生态。
利用AI知识图谱,腾讯取代了传统的科普方式,把枯燥、零散的知识以专业的数据结构连接起来,让我们更直观生动的了解各类知识。这是腾讯科技公益互助计划在生态领域公益保护的全新探索。
此外,小程序还提供了体验四川卧龙国家级自然保护区的雪豹「巡护员」工作的功能,可以让我们为保护稀有动物、保护自然生态献一份力。
而这背后,便是腾讯「科技向善」的价值观。
目前,腾讯云小微AI团队已经通过与行业专家合作(如中科院昆明植物所)、公司内数据资源整合、线上资源积累等多种方式,建设了数十个通用领域知识图谱,包含亿级实体及十亿级关系。
相信在不就的未来,腾讯云小微可以让公益变得更加生动、有趣,也可以让吸引更多人参与其中。
最后,要问科技的魅力到底是什么?
或许答案正如腾讯所体现的——造福社会、造福人类。
你说呢?
参考链接:
https://zhuanlan.zhihu.com/p/71128505
https://mp.weixin.qq.com/s/Y1mhFyvwx1IhKZWtzx14NA
- 大模型上了火山方舟:数据唯你可见,唯你所用,唯你所有2024-11-14
- Keras之父,离职谷歌2024-11-14
- OpenAI华人VP翁荔离职:北大校友,掌管安全,最近B站分享被热议2024-11-09
- 百度发布iRAG,李彦宏:AI行业最大变化是大模型基本消除幻觉2024-11-12