腾讯李学朝:从数字人到数智人,塑造全新生产力

数字人发展十大趋势

7月29日,2022全球数字经济大会暨互联网3.0峰会数字人生态发展论坛在北京召开,本次论坛汇聚数字人产业政、产、学、研、企重量级嘉宾,共同探讨数字人产业发展。

会上,由中国信息通信研究院云计算与大数据研究所牵头,联合腾讯等机构共同制定的全球首个数字人国际标准ITU-T F.748.15 “Framework and metrics for digital human application system”(数字人应用系统基础框架和评测指标)正式发布。

在“深度洞察”环节,腾讯智能产品副总裁李学朝通过题为《从数字人到数智人,塑造全新生产力》的主题演讲,分享了腾讯云小微、腾讯研究院和创业黑马经过产业研究、实地调研,共同提炼总结的“数字人发展十大趋势”。


(腾讯智能产品副总裁 李学朝)

李学朝表示,数字人是互联网3.0的重要入口,正在发生一系列深刻的技术、应用演进。其演进可分为离线-在线-在场三个阶段,从“离线”到“在线”,是技术对效率的解放。而未来,从“在线”走向“在场”,技术演进将推动线上和线下更全面地一体化,进入全真互联。“依托于AI技术从感知到决策到表达的一系列突破,数智人可以与数字场景、行业理解更深度耦合,加速转化为现实生产力,实现全面‘在场’服务。”李学朝表示。

“技术应用的终极价值是服务于人。”在演讲中,李学朝分享了腾讯在数字人领域的探索。通过整合ASR、NLP、语音交互、自然语言理解、图像识别、TTS、知识图谱等全栈AI能力,连接腾讯丰富的内容和服务生态,以及面向使用场景打磨平台能力,腾讯云小微助力行业客户打造出有智能、有形象、可交互的数字分身,实现了从“数字人”到“数智人”的智能化升级。目前,腾讯云小微数智人已经在银行、证券、传媒、文旅、出行等多个行业场景中落地。

李学朝表示,未来腾讯云小微希望与更多合作伙伴共同推动技术进步,探索数字人应用落地产业,面向行业提供有温度的交互智能服务,共同助力中国数字化建设。

以下为演讲实录:

尊敬的各位嘉宾、媒体朋友们:

大家好,我是腾讯李学朝,很高兴能在数字人生态发展论坛与大家进行交流。

今年以来,互联网3.0成为了行业关注焦点。随着数字世界和物理世界加速无缝衔接,以人工智能、大数据、云计算为代表的数字技术深入生产生活,为各行各业升级转型打开新的想象空间。

其中,数字人作为AI技术具像化的一种展现形式,是互联网3.0的重要入口,也在发生一系列深刻的技术、应用演进。

我们把这种变化拆解为离线-在线-在场三个阶段。在“离线”初始阶段,依托动画与渲染技术,身份型的虚拟数字人,以真人偶像的数字分身,虚拟代言人等身份,在数字营销、文娱等领域得到广泛的落地展示。近几年,数字人开始进入“在线”服务。通过掌握语义智能解析、语音在线合成等AI技术,数字人升级为“数智人”,进入金融、传媒、出行、文旅等领域,为终端用户提供数字客服、数字导览、数字主播等服务,助力企业和组织落地数字化转型,实现降本增效。

从“离线”到“在线”,是技术对效率的解放。而未来,从“在线”走向“在场”,技术演进将推动线上和线下更全面地一体化,进入全真互联,也是Web 3.0的真正落地。依托于AI技术从感知到决策到表达的一系列突破,数智人将与数字场景、行业理解深度耦合,加速转化为现实生产力,实现全面“在场”服务。

从离线到在线到在场,技术应用的终极价值是“服务于人”。在这个过程中,数字人行业会用到哪些新技术,采用哪些新模式,出现哪些新增长点?带着这些疑问,我们和腾讯研究院、创业黑马在过去一段时间,进行了一系列的行业调研,借着今天这个场合,也和大家分享一下我们的观察与思考。

第一,从产品形态上看,短期内多种类型数字虚拟人共存,建模、渲染、驱动等技术环节相对同质化。

我们可以看到,目前数字虚拟人主要分为功能服务型数字人,即数字员工,以及身份型数字人两种。在每种类型中,建模、动捕、驱动和渲染这些技术已经相对同质化和流水线化,产业链分工愈趋明确,说明产业和技术已经到达第一个成熟期。

第二,从核心价值上看,艺术性、IP和运营能力是身份型数字人核心,功能服务型数字人本质是借助AI实现人的增强和辅助。

功能服务型数字人的重点在于AI技术突破,AI技术驱动多模态输入感知、多模态交互能力不断完善,ASR、NLP、TTS、STA、情感计算也是技术突破的重点方向。

第三,从技术融合维度看,数字人技术与SLAM、体积视频等技术将实现深度融合,云端渲染是重要关注点。

数字人作为3D呈现的一种方式,与其他3D技术如SLAM、体积视频融合,会对渲染能力提出较高需求。因此,我们判断未来的技术方向是云端渲染推流到终端,或者是通过端云协同,云端和终端分别渲染场景和数字人。

第四,目前数字人展示平台,主要以传统显示设备为主,PC、手机、大屏是主流显示硬件。但我们看到,数字人和3D数字内容的结合,对于裸眼3D、VR、AR等硬件的普及具有推动作用,沉浸式设备在特定领域将成为最优解。

第五,从行业应用上看,数字人建立了AI与人的连接,成为一个新型交互入口。

当数字人向数智人发展,在不改变业务逻辑的情况下,目前使用文字、语音交互的场景都可以用AI数智人进行协同和辅助,从而向用户提供更好的陪伴。未来数智人可以与更多的行业场景进行深度结合,产生千行千面的数字员工,成为提供行业服务的必选项。

第六,从C端应用上看,平台工具会推动应用门槛和制作成本下降,这时候UGC数字人和新商业模式将加速出现。

我们也看到,伴随AI视频驱动技术的发展,易操作的数字人生产、服务平台陆续出现,未来普通用户也可以用低成本制作数字人,UGC模式将会普及。

第七,数字人推动AI技术从后台走向前端,打通感知-决策-表达闭环。

过去,AI技术更多是底层技术引用,在后台的数据处理领域,比如算法推荐、图像处理发挥效用。现在,数字人集合了多种AI技术,通过ASR-NLP-TTS等AI技术建立感知-决策-表达闭环,使得AI技术从单纯的数据处理,走向前端,被用户深刻感知。

第八,在产业聚集上,数字人发展依托艺术和技术的双轮驱动,北京有望成为产业新高地。

数字人研发需要艺术和技术双重人才,北京、深圳、杭州、成都将成为数字人产业的重要聚居地。其中,北京文化产业和科技产业优势突出,政府高度重视数字人产业发展,也是全国首个发布数字人发展支持政策的城市,有望成为产业发展新高地。

第九,我们从挑战上看,目前数字人权益保护仍处在探索期,数字人著作权、商标权、真人形象授权、 真人声音授权等知识产权管理等问题较为突出。只有依靠产业共同努力,才能推动数字人产业实现可用、可靠、可知、可控。

最后,我们也再讲讲对行业趋势的判断。正如开头所提及的,离线-在线-在场是数字人发展的必然路径。

从关注动画、渲染的身份型数字人,到融合语言理解能力、表达能力、学习能力、交互能力的服务型数智人,从在线服务到在场体验,数字人将进入大规模应用期,加速转化为现实生产力,为消费市场和企业服务创造更大价值。

从离线到在线到在场,腾讯在数字人产业一直不断深耕和探索。当交互模式从文本升级为语音,再到多模态人机交互系统,沟通效率和服务温度都得到了大幅提升。

腾讯云小微通过整合ASR、NLP、语音交互、自然语言理解、图像识别、TTS、知识图谱等AI能力,连接腾讯丰富的内容和服务生态,面向使用场景打磨平台能力,助力行业客户打造出有智能、有形象、可交互的数字分身,实现从“数字人”到“数智人”的智能化升级。

就在最近,腾讯云小微刚刚和中国国家博物馆合作,推出了国博首个虚拟形象代言人“艾雯雯”。通过文博语料的训练,“艾雯雯”可以实现对140余万藏品讲解知识倒背入流,并能通过自学习、自适应不断提升对行业、场景和用户的理解能力、应变能力和表达能力,更好地为全球游客讲解中华文明,让中国文化走向世界。

截至目前,由腾讯云小微技术驱动的数智人已经在银行、证券、教育、政务、传媒、文旅、出行等多个行业场景中落地。

例如,在传媒领域,年初的冰雪赛事上,腾讯3D手语数智人“聆语”出任央视频AI手语翻译官,用近2000个手语动作为听障观众解读赛事直播,是行业首次尝试。在金融领域,我们与中信建投证券共同打造虚拟坐席,通过数智人实现视频见证开户,在证券行业落地首个可交互的数字员工。出行领域,在一汽-大众云展厅,数智人Ida经过汽车行业专用语料训练,变身为汽车导购“数智分身”,可以像真人专业汽车导购一样,为顾客带来沉浸式的购车体验。

从数字人到数智人,最大的变化是实现“听得清、听得懂、会表达”。我们相信,伴随交互智能技术的加速发展,数智人将会成为各行业塑造竞争优势的新生产力,促进更高效的产业协作,达到更优质的用户体验。

今天的论坛,汇集了数字人行业产、学、研领域的重量级嘉宾。未来,我们希望和大家共同推动技术进步,与合作伙伴共同探索数字人应用落地产业,提供有温度的交互智能服务,一起助力中国数字化建设。

版权所有,未经授权不得以任何形式转载及使用,违者必究。