李彦宏：大模型即将改变世界，百度要第一个把全部产品用大模型重做一遍

萧箫 2023-05-26 16:55:22 来源：量子位

“先上全球AI竞赛牌桌，才能拥有话语权”

鱼羊萧箫发自凹非寺
量子位 | 公众号 QbitAI

大模型即将改变世界。

先上牌桌，才能拥有话语权。

这就是站在技术浪潮的最前沿，李彦宏的最新感悟。

在今天的2023中关村论坛上，李彦宏作为开场嘉宾，发表了题为《大模型改变世界》的演讲。

这一国际科技大会由科技部、国家发展改革委、工业和信息化部、国务院国资委、中国科学院、中国工程院、中国科协、北京市政府共同主办。演讲嘉宾包括微软创始人比尔·盖茨，以及菲尔兹奖得主、图灵奖得主等顶级科学家代表。

规格之高，不消多说。而微软和百度，又是如今大洋两岸最受关注的引领大模型变革的科技公司，双方创始人同台演讲，早已引发不少关注。

不过，相比于技术本身的“卷”，科技领袖们的着眼点，更加本质。

比如，大模型成为焦点的实质是什么——

大模型成功地压缩了人类对于整个世界的认知，让我们看到了实现通用人工智能的路径。

李彦宏如是分析。

并且，在更为深刻地影响世界之前，AI本身已经因大模型的出现而改变。

处在以大模型为核心的人工智能新起点，现实应用的构建逻辑也已经到了转变的时刻：

用大模型重做产品，“不是整合，不是接入，而是重做，重构”。

大模型改变人工智能，即将改变世界

为什么说大模型改变了人工智能，又即将改变世界？李彦宏给出了三方面的思考。

首先，是技术本身的突破。

第一个关键词，就是大算力+大模型+大数据，导致的智能涌现。

目前，业界的普遍认识是，500亿-600亿参数，是大模型是否具备涌现能力的一个门槛。

所谓智能涌现，简单说就是大模型让AI学会了“无师自通”，即便是此前没有接触过的任务，大模型也能hold得住。

举个例子，有用户发现，在要求ChatGPT扮演Linux终端来运行代码时，ChatGPT真的可以搞定这件事。而这种query在语言模型的训练阶段几乎不可能出现。

这彻底颠覆了过去AI应用的生产模式，使得AI流水线工厂取代“一事一模型”的AI手工作坊成为可能，使得AI应用的规模化落地成为可能。

与此同时，人工智能发展方向从辨别式走向生成式。

从数学模型上来说，辨别式模型关注的是不同类别的决策边界，而生成式模型则学习了数据的潜在特征，能通过理解每个类别的底层分布，来学习数据是如何生成的。

△图源LearnOpenCV

从实际案例来说，搜索引擎就是经典的辨别式AI。而文心一言这种会进行文学创作、写报告、画海报的，就是生成式AI。

生成式AI不仅使得人工智能更具“创造力”，更关键的是，它重新定义了人机交互：

对于人类而言，最自然的交流方式就是语言沟通。如果一句话就能让电脑帮你整理数据绘制图表，当然会比手动点开一大堆数据页面再逐个整理分析高效得多。

值得关注的是，大模型改变人工智能背后，底层的IT技术栈也发生了根本变化，即从芯片层（CPU为主）、操作系统层、应用层的三层架构，发展成为了四层架构：芯片层（GPU为主）+框架层+模型层+应用层。

这种IT架构的适配，正是“大力出奇迹”的基础，使得大算力、大模型、大数据能够三位一体，集中到一起打配合。

目前，无论是国外的微软、谷歌、亚马逊，还是国内的百度，都有从底层硬件到上层应用软硬一体的布局。

其中，只有百度是全球唯一全栈布局四层架构的公司。

其次，是产业需求的变化。

此前，李彦宏曾预测，大模型时代将产生三大产业机会，分别是：

新型云计算：其主流商业模式从IaaS变为MaaS。企业选择云厂商的关键因素，会从算力、存储等基础云服务，向框架、模型，以及模型、框架、芯片、应用四层之间的协同转变。
行业模型精调：通用大模型和企业之间的中间层，可以基于对行业的洞察，调用通用大模型能力，为行业客户提供解决方案。
基于大模型底座的应用开发

在这背后，需求侧的逻辑是，产业的需求在大模型的冲击下会发生改变，充分发挥大模型降本增效能力的AI原生思维将会影响所有产品、服务和工作流程。

那么，什么样的应用是AI原生应用？尽管还在探索的初期阶段，但大模型兴起以来，完全基于AI孵化出的创新产品已经崭露头角。

比如Jasper，一个通过AI帮助企业和个人写营销推广文案的应用。截至去年10月，Jasper估值已达15亿美元。

而AI绘画应用Midjourney，则已凭借订阅付费模式，在一年内实现了约1亿美元的营收。

李彦宏提到，百度内部的办公软件如流，现在也已基于文心一言，给每一位员工配备了一个具有丰富专业知识，能实时响应的工作助理。这个AI助理通过对话理解能力，可以实现对聊天记录的智能总结，在百度内部获得了一众好评。

李彦宏还强调：

百度要做第一个把全部产品重做一遍的公司，不是整合，不是接入，是重做，重构！

实际上，不止于百度，李彦宏认为，未来的趋势是所有应用都将基于大模型来开发。大模型最终深度融合到实体经济当中的具体体现，会是每个行业都有属于自己的大模型。

最后，是人们日常生活的改变。

大模型能快速破圈，成为街头巷尾人人讨论的话题，与其给个人带来的直观效率提升不无关系。

李彦宏引用研究机构的数据指出：未来10年，知识工作者的效率可以提升4倍。

这种效率提升，甚至会彻底改变人们的工作方式：

AI原生应用涌现之后，大量的工作交互最后都会编程提示词工程。

未来你的薪酬水平，将取决于你的提示词写得好不好，而不是取决于你的代码写得好不好。

李彦宏甚至大胆预测：10年后，全世界有50%的工作会是提示词工程，提出问题比解决问题更重要。

作为全球大模型竞逐中，国内最接近华山之巅的一号位，李彦宏的思考，亦是一份大模型落地征途中最具价值的参考答案。

事实上，以上三重思考，不仅停留在理论，百度本身已在躬身实践。

而另一方面，李彦宏放言“百度要做第一个把全部产品重做一遍的公司”，亦是行业大势之下，竞逐牌桌上话语权的决心体现。

百度为什么能做到？

百度发力大模型的更深层次原因，或许可以从行业现状和技术积累两个方面来解读。

首先是行业趋势。当下以大模型技术为代表的AIGC领域，已经开始从技术和应用两方面变革各行各业的生产方式，甚至带来突破性的效率提升。

根据量子位智库预测，AIGC市场规模会在2030年达到1.15万亿元，期间将经历培育摸索期、应用蓬勃期和整体加速期三个阶段。

△来源于量子位智库

即使目前还在培育摸索期阶段，新玩家还在不断涌现，大模型头部领域的竞争却已经到了白热化阶段。

尤其行业中进展最快的技术玩家，已经开始有上层应用落地的趋势。

在国外，以OpenAI为例，根据SimilarWeb数据，ChatGPT仅2023年4月份，全球访问量就已经达到17.6亿次；至于与ChatGPT和GPT-3相关的应用，据gpt3demo统计已经超过800个，光是这两个月就增加了200多个。

在国内，百度也已经透露了大模型相关应用数据。文心一言开始企业内测之后，在与百度智能云接洽大模型业务的客户中，新客户比例已经超过老客户比例，有超过300+企业参与内测。

显然，当底层大模型技术达到稳定进入实际生产环节的水平，上层就会不断开发出真正有突破性质量的应用。

伴随着应用数量不断增加形成生态，最终将彻底在电商、内容、办公、交通等领域产生巨大的行业变革。

△来源于量子位智库

营销客服行业，百度文心一言目前已经将智能客服的知识生产效率提升了9倍，多轮对话构建的成本下降65%，终端用户认为客服接近真人的比率也在上升。

城市交通行业，目前北京亦庄的300多个路口，全都部署了百度AI信控系统，通过智能调整红绿灯的时间，提升最高30%的交通效率，有效解决了北京堵车这一“历史性难题”。

但若仅仅从行业变革的速率和市场规模角度出发，还无法完全解释百度发力大模型的原因。

毕竟从打造大模型的算力、数据和算法等层面的难度来看，仅凭短期的技术自研，显然难以支撑“快速重构所有产品”这一做法。

因此，从自身实力来看，百度这些年在自研芯片、架构到AI算法等各方面的“技术基底”，恰恰又成为了发力这波大模型浪潮必备的关键因素。

具体来说，主要可以分为三个方面。

其一，是在AI技术、尤其是大模型技术上的长期投入和积累。

最早从2013年开始，百度就在布局AI相关的技术，累计十年下来已经投入超过1000亿元，其中核心研发投入多个季度占比超过20%；

巨量研发投入背后，是技术护城河的建立，截至2022年4月，百度全球AI专利申请已经超过2.2万件。

这样的技术积累，让百度如今在大模型研发必不可少的芯片、框架、模型和应用四层架构中，均实现了对应的自研技术积累。

芯片层上，百度自研芯片昆仑二代，已经量产并部署了几万片，而昆仑芯最新的第三代，则预计2024年初投入量产；

框架层上，百度从2016年就开源了飞桨深度学习框架，目前这一框架已经集成了深度学习核心训练和推理框架、基础模型库、端到端开发套件等工具组件，在中国市场份额中排行第一；

模型层上，文心一言背后的核心技术文心大模型，从2019年开始就已经发布1.0版本，并在后续研发中不断进行优化，目前已经迭代到3.5版本；

应用层上，百度除了研发了单独的十个行业大模型以外，在搜索、智能云、自动驾驶、小度等上面也已经积累了不少研发经验。

不过，在各层技术栈上“单独发力”，还只是百度大模型的核心竞争力的一部分。

其二，针对这四层核心架构打出“组合拳”，又进一步形成了百度独特的技术优势。

虽然国外如亚马逊、国内阿里都已经在芯片层、模型层上发展了自研技术，微软则也已经在框架层和应用技术上有所准备。

但百度之所以同时发力自研芯片、框架、模型和应用领域，正是侧重于优化这些架构之间的高效协同，从而让自研大模型的基础设施能力进一步提升。

打个比方，对于大模型而言，想要极致优化推理速度和使用成本，算力、框架、模型、应用就像是四个齿轮，各自转速之外，很大程度上还要看它们之间的“配合能力”。

如今，这种“配合能力”，也已经成为百度发力大模型的独特优势。

打通四层技术架构后，百度已经能在基础设施层面上，打出千卡加速比90%、资源利用率70%，开发效率提升100%这样的“组合拳”。

如今，这一套组合拳更是在文心一言大模型应用的成本上，有直观的体现：

此前3月份启动内测时，如今不到2个月，百度大模型文心一言已完成4次技术版本升级，其推理成本更是已经降为原来的十分之一。

最后，在自主可控上，百度的这些技术不仅能用在自身大模型上，还能反过来进一步加速行业大模型的生产落地。

换而言之，文心一言不仅做到了数据可控、框架可控、模型可控，在全球科技领域中拥有话语权，更能将这一套技术对外输出，助力行业加速打造更多大模型。

以百度已经在内测的文心千帆大模型平台为例，仅需少量数据、最快几分钟，大模型就能完成一次“定制化”，极大地加速了大模型从研发到生产的全套过程。

而文心千帆的这一套流水线，并非仅为文心一言所打造，其训练调优经验和技术，已经可以向第三方输出。

换而言之，百度不仅是这波大模型变革浪潮的“参与者”，更是其中的“发力者”，其技术不仅可以用于构建大模型底座，更能对外输出，让国内更多玩家在这一领域具备国际竞争力。

“先上全球AI竞赛的牌桌，才能拥有话语权”

不过，在大模型应用范围日渐扩增、关注度愈发火热的当下，AI行业下一步究竟该如何走，国内外学界和产业巨头中也出现了不一样的声音。

国外玩家中，要属在大模型这一领域进展最快的OpenAI观点最受关注。

作为OpenAI创始人，Sam Altman认为AI技术必将改变世界，因此必须对技术进行监管。

目前，OpenAI已经主动提出对行业接下来要发展的AI技术进行控制，甚至建立对应的国际AI监管机构：

未来十年内，人工智能系统将在很多领域超越专家水平，并且产出能够与当今的最大企业相匹敌。

同样，微软创始人比尔·盖茨也在采访中提到，AI正在给就业医疗等领域带来变革性的影响力，但随着技术发展，监管是必不可少的因素。

不过，马斯克则是直接反对行业继续探索AGI相关的技术，不仅参与签署了“暂停巨型AI实验”的千人联名信，还呼吁暂停更先进的AI系统训练。

显然，在AGI研究日渐火热的当下，要不要继续发展大模型技术，是否会出现“失控”危害人类的超级智能AI，已经成为一个颇具争议性的观点。

作为国内大模型头号玩家的掌舵者，李彦宏如何看待这一话题？

从国际竞争的角度来看，李彦宏认为，在国内外大模型技术发展存在一定差距的当下，发展技术仍旧是优先级最高的选择。

以中国科学家企业家的身份，李彦宏依旧坚信“技术改变世界”的观念：

至少要先上牌桌，赢得全球竞赛的入场券，才能获得话语权，参与规则的制定。

大模型李彦宏百度

萧箫

李彦宏：大模型即将改变世界，百度要第一个把全部产品用大模型重做一遍

大模型改变人工智能，即将改变世界

首先，是技术本身的突破。

其次，是产业需求的变化。

最后，是人们日常生活的改变。

百度为什么能做到？

“先上全球AI竞赛的牌桌，才能拥有话语权”

相关阅读

大模型学好编程，常识逻辑能力一起提升！网友：GPT-4更强的关键所在？

ChatGPT被「神秘代码」攻破安全限制！毁灭人类步骤脱口而出，羊驼和Claude无一幸免

北大&腾讯打造多模态15边形战士！语言作“纽带”，拳打脚踢各模态，超越Imagebind

2018互联网女皇报告发布：人工智能竞争，中国势头强劲（附全文）

“大模型本质就是两个文件！”特斯拉前AI总监爆火LLM科普，时长1小时，面向普通大众

大模型做时序预测也很强！华人团队激活LLM新能力，超越一众传统模型实现SOTA

热门文章

雷军：地表最强四门车，小米造！自曝造车起步估值超700亿

陶哲轩在IMO上给AI团队颁奖！他们要做AI数学的ImageNet

给iPhone背面贴个AI录音机，生意老好了

AI视频修复速度10倍提升，过曝变色也能逐帧搞定｜美图国科大新算法

微软蓝屏搞瘫全球，马斯克很生气，原因很尴尬