百度集团副总裁吴甜:技术创新持续为产业注入新动能 | MEET2022
技术越来越复杂,应用门槛却在降低
编辑部 发自 凹非寺
量子位 报道 | 公众号 QbitAI
今天,我们正处在新一轮科技革命和产业变革的浪潮当中。
这一场浪潮给整个社会带来了深刻的变化。
根据中国信息通信研究院的数据,2020年我国数字经济规模达到39.2万亿元,占GDP总值的38.6%,位居世界第二。
未来数字经济的绝对值及相对比例会持续增加。
数字产业化和产业数字化双方面齐头并进,进一步推动数字经济和实体经济深度融合。
在MEET2022智能未来大会上,百度集团副总裁、深度学习技术及应用国家工程实验室副主任吴甜分享了技术创新与产业发展的关系。
为了完整体现吴甜的分享及思考,在不改变原意的基础上,量子位对她的演讲内容进行了编辑整理。
关于MEET 智能未来大会:MEET大会是由量子位主办的智能科技领域顶级商业峰会,致力于探讨前沿科技技术的落地与行业应用。MEET2022采取线上参会形式,20余家直播平台和渠道转播大会直播,200万行业用户线上参会。除量子位微信、头条号、知乎、微博等全媒体矩阵外,新华社、凤凰科技、腾讯科技、澎湃新闻等数十家主流媒体纷纷报道大会及相关内容,线上曝光量累计超过2000万。
演讲要点
- 人工智能落地应用的场景非常广泛且分散,并呈现出越来越深入、越来越专业的趋势
- AI技术呈现出融合创新趋势,包括软硬一体融合、跨模态多技术融合、知识与深度学习融合、技术与场景融合
- 底层技术越变越复杂,但开源开放的平台使得AI开发变得越来越容易
- 技术创新持续为产业运用人工智能技术注入新的动能
(以下为吴甜演讲分享全文)
技术与产业越来越广泛地结合
从艾瑞咨询《中国人工智能产业研究报告 III》中可以看出,人工智能新技术已经广泛渗透进了经济生产生活的主要环节里。
我国的大型企业在十四五规划期间都已经开始规划和部署,或者是即将部署人工智能相关技术的落地,以及与生产活动的进一步结合与渗透。
关于这一点,还可以从一组更详实具体的数据中一窥究竟:
百度的AI首席架构师培养计划 (AICA计划) 从2019年起已经举办了五期。
从每期学员提出的课题分析,从中可以看出,人工智能落地应用的场景非常广泛且分散,同时在技术和产业的结合过程当中,呈现出越来越深入、越来越专业的趋势。
从产业发展趋势一侧来说,我们已经看到了未来更大更广阔的应用前景。
那么从另一侧的技术趋势角度看,未来在技术推动下又有一些什么样的发展呢?
AI技术呈融合创新趋势
随着人工智能技术和应用场景的结合越来越深入,AI技术已经呈现出非常明显的融合创新的趋势,我从4个方面做一些解读。
软硬一体融合:
首先AI算法模型以软件形态为主,软件的能力正在变得越来越强。AI模型在训练以及应用推理部署进行预测的环节,都需要消耗很多的算力。
软件和硬件进行一体化的设计是一个非常重要的发展趋势,软件设计本身在影响着甚至决定了硬件的设计,这是未来把人工智能技术代入到产业当中的重要融合方向。
跨模态多技术融合:
AI技术在解决实际场景问题的时候,语音技术、视觉技术还有自然语言处理技术往往需要进行跨模态多技术融合。
以机器人、虚拟数字人为例,他们需要对世界的感知能力,也需要对世界的认知能力。
跨模态多技术融合可以解决场景当中的多模交互问题,进一步的算法也能增强对于整个世界的理解能力。
知识和深度学习的融合:
第三个创新融合的趋势是知识和深度学习的融合,知识和深度学习结合之后,可以加强机器的逻辑推理以及对世界的深层次的认知水平。
技术和场景的融合:
人工智能技术作为理论性和实践性兼备的技术,在使用过程当中会不断地和场景之间进行融合。
技术的发展使得我们有了更多应用场景,应用场景的更高要求反过来也对技术提出了更多的要求,并且促进了技术的进一步发展。
技术在变复杂,应用门槛却在降低
基础技术越变越复杂,也越来越多地出现了跨技术领域、跨模态的融合。
所幸的是,开源开放的人工智能平台使得上层应用越来越低门槛,降低成本、提高效率,让AI开发变的越来越容易。
我们相信未来,随着产业的需求越来越多和越来越广,技术和产业的结合会逐渐变成一个大规模落地,大规模生产应用的状态,形成工业大生产状态。
实现AI规模化生产应用后的景象如何,我们现在不太容易想象,我以一个例子作比,方便大家理解:
以前的高阶木匠,比如我的一个同事的长辈就是八级木匠,从小就开始练习,经过很多实践、训练,而且还需要有禀赋才能获得这样的称号。
今天这么高级别的木匠已经很少有了。
我们使用的现代的家具高性价比,时尚美观,整个生产模式转向模块化、组件化,和原来有了本质上的变化。
以前必须只能由高级匠人做的很多工作,由新的模式带动着更低成本、更高效率地进入了规模化生产状态,高级匠人们可以做更具有收藏性的作品了。
未来,AI生产也会有类似的景象。实现这个景象,对于AI生产来说,需要基础支撑性生产平台,产业级深度学习开源开放平台飞桨就是在降低AI生产门槛、支持规模化生产应用,包含核心框架、基础模型库、端到端开发套件、工具组件、学习与实训社区、企业版平台,从数据、开发、训练、部署、资源各个角度支持产业级应用。
技术发展带来新的想象空间
依托于飞桨平台,结合大规模预训练带来的技术新范式,更是带来了规模化产业应用的新想象空间。
基于大数据、大规模知识以及大算力平台,我们通过自监督学习方法训练出来的大规模预训练模型,成为了整套系统的底座模型,拥有了通用的基础能力。
在面向任务场景的时候,只要加入少量任务数据,再配合上迁移学习的方法,比如说少样本学习,比如说Fine-Tuning 或Prompt Tuning,就可以打造出场景任务上好用的模型。
这套机制使得面向上层应用场景的门槛降得越来越低,而数据、算力、人力成本等应用成本也降低了。
更关键是在效果上,因为底座模型已经学习了大规模数据当中的知识与规律,在最终应用时,效果出色,甚至在很多场景下实现从不可用到可用的跨越。
我以知识增强的预训练模型ERNIE为例来和大家分享:
ERNIE通过多任务学习器的设计,配合自监督学习任务的构建,从大规模的无标注海量数据和知识当中学习规律,这个模型在大量的自然语言处理任务上都表现出非常好的效果。
今年夏天我们在上述技术创新基础上,发布了知识增强大模型ERNIE 3.0。
ERNIE 3.0里面首次把文本和知识数据进行了融合训练,是理解和生成模型并重,并通过飞桨上的超大规模并行训练技术产生出来的模型。
ERNIE 3.0一经发布就在50多项中文NLP评测集上取得了最好的效果,英文模型在国际权威的复杂自然语言理解任务SuperGLUE上超过人类水平0.8个百分点,荣登榜首。
ERNIE3.0不仅理解能力强,同时还具有非常好的创作能力,已经形成一个系列底座模型。
但要把这些底座模型用起来,仅仅有模型是不够的,通过零门槛AI开发平台EasyDL可以非常便捷地使用这些底座模型,在平台当中有预训练模型库、预制的任务库等,从数据服务到训练开发还有推理部署的整套工具。
以金融领域常见的“合同智能解析与管理”场景为例,操作人员需要对保险合同条款文本进行解析识别,但人工效率很低,业务变化快的时候就带来系统鲁棒性不足的问题。
应用上基于ERNIE训练出的条款智能解析模型之后,每单时长从人工30分钟降到1分钟,效果非常明显。类似的事情也同样发生在其他各行各业。
总结来看,产业趋势上,随着数字技术与实体经济深度结合,越来越广泛的场景对于引入AI技术进行创新提出需求和打开了想象空间,技术趋势上,复杂的AI技术积累和沉淀于平台,开源开放平台降低了应用的门槛,并且大规模预训练等技术结合产业实践的创新持续带来了发展的新动能,使AI有机会实现大规模生产应用,距离每个人都更进一步,再进一步。相信技术带来的新变化持续发生,给生产生活不断带来新变化,成为产业发展的重要动力。
*注:在这次演讲之后,百度与鹏城实验室在12月8日联合召开发布会,正式发布了双方共同研发的全球首个知识增强千亿大模型——鹏城-百度·文心(模型版本号:ERNIE 3.0 Titan),该模型参数规模达到2600亿,是目前全球最大中文单体模型,在60多项NLP任务中取得世界最好效果。同时,百度产业级知识增强大模型“文心”全景图首次亮相,从技术自主创新和加速产业应用两方面,推动中国自研AI技术发展更进一步。
- 腾讯发最大开源MoE模型,3890亿参数免费可商用,跑分超Llama3.12024-11-06
- Llama版o1来了,来自上海AI Lab,强化学习代码已开源,基于AlphaGo Zero范式2024-11-05
- 慢思考准确率反降30%!普林斯顿揭示思维链某些任务上失效的秘密2024-11-04
- 帮了一把南美农民的拼多多,联合国粮农组织都点赞了2024-10-31