Why always百度?OpenAI有的他有,OpenAI没有的他还有

此刻,百度正站在浪潮之巅

鱼羊 一言 发自 凹非寺

量子位 | 公众号 QbitAI

此时此刻,枕戈待旦,全力冲刺。

这是最新一季财报披露后,李彦宏在全员信中表达的百度状态。

也是大语言模型技术火爆中,寻找中国版、抓住人工智能新范式机遇的呼声中,百度获得的期待——关于谁能给出最好回应?

在中国,最先被想到、最后被确定、最被多数人看好的,唯有百度。

看好百度,确实有最直接的原因:OpenAI有的他有,OpenAI没有的他还有。百度早就完成了大模型技术研发,文心大模型技术力突出,产业落地还领先;百度还有天然的场景和资源,先进的计算资源,无人能比的中文搜索优势。

但让李彦宏壮怀激烈的,不止于此。

他看到的是人人都开始谈论人工智能的颠覆性影响;他激动的是生成式AI和大模型的智能涌现给计算范式带来的全新机遇,他认为AI技术已经发展到一个临界点,各行各业都不可避免地被改变。

百度创始人还强调,曾经的提前出发和布局,只为现在机会来临时能够率先抓住机遇,勇敢创新,用创新驱动新的增长。

中国AI市场即将迎来爆发性的需求增长,其商业价值的释放将是前所未有的、指数级的。而百度作为中国人工智能市场长期增长的最佳代表,正站在浪潮之巅。

而这种前所未有的变革,将从文心一言带来的重塑开始。

最受关注的还是大语言模型“文心一言”

此前,百度已经释出3月份上线新一代大语言模型产品“文心一言”的消息。

而李彦宏内部信也用一半篇幅,进一步显现了百度对这一生成式AI产品的重视。

根据内部信,百度计划将多项主流业务与文心一言整合:

• 文心一言与搜索整合,将引领搜索体验的代际变革;

• 文心一言将通过百度智能云对外界提供服务,根本性地改变云计算市场的游戏规则;

• 文心一言将进入Apollo智舱系列产品,并与小度进行集成。

就是说,文心一言这一对话类生成式AI,不仅会出现在百度自家的搜索、语音助手产品中,还将对外输出。

目前,已经有不少媒体、机构,宣布将接入文心一言。

在财报电话会上,针对外界普遍关心的文心一言的表现,李彦宏信心十足:

百度的文心大模型是中国市场非常本土化的大语言模型,这意味着百度现在正在研发的文心一言,将比国外开发的模型更适合中文和中国市场。

财报发布后,百度美股盘前涨超6%。

种种现象表明,在生成式AI这件事上,国内最受关注、最受期待、最被看好的,还是百度。

其中原因,既与公司属性有关,又是百度占据“地利”的体现。

自大语言模型引发热议以来,不少业内人士都指出,此类产品需要耗费巨量云计算资源。OpenAI本身的成功,离不开微软这棵大树:

早在2019年,微软就给OpenAI砸了10亿美元,成为其独家云计算供应商。截至今年,微软已累计向OpenAI投了130亿美元。

因此仅从成本的角度考虑,国内BAT等本身拥有云计算业务的大厂,天然具有算力资源优势

在其中,百度在算法和数据方面的储备优势最为明显。

最直接的技术储备方面,百度在大模型上的技术积累可以说是国内独一档的存在。

2019年,百度就提出了ERNIE。ERNIE是一种知识增强的预训练模型,即在深度学习的基础上融入了知识图谱。

中文语言环境中,ERNIE在完形填空、命名实体识别、情感分类等任务场景中,都有优于BERT的表现,曾一度登顶NLP权威数据集GLUE榜单,并创纪录地首次突破了90分大关。

百度的大语言模型文心一言正是在ERNIE的技术树上发展而来。

其大模型体系,已经横跨NLP、CV、多模态、生物计算四大基础领域,还在电力、燃气、金融、航天、传媒等11个行业中以行业大模型的形态,积累了落地实践经验。

从ERNIE 1.0算起,文心大模型在公开权威语义评测中已斩获十余项世界冠军。

值得一提的是,在Chatbot初露头角之时,百度就发布过开放域对话大模型PLATO-XL。这是全球首个百亿参数的中英文对话预训练生成模型。

算法之外,以搜索为核心业务的百度,还拥有20年产品业务沉淀下来的海量数据和用户。

数据对于大模型的意义无需多言。而英伟达AI科学家Jim Fan还做过这样一个对比,阐述谷歌作为后发者,在面对OpenAI挑战时仍然具备的优势:

即在用户量远超对手的情况下,一旦开放用户体验与用户持续反馈的飞轮建立起来,对话AI产品的反馈迭代速度将直接起飞。

对于百度而言,这一点同样适用。2022年12月数据显示,百度App月活跃用户达到了6.48亿,同比增长4%。

更重要的是,在开发大模型这件事上,李彦宏内部信中也强调了百度已经具备的完整技术栈:从底层芯片,到训练框架,再到模型、应用,百度均有自研技术。

这也就意味着,百度有能力把算力、算法、数据三大要素集结到同一个体系结构当中。这种综合优势在中国乃至全球范围内,都只有少数几家人工智能公司具备。

自身实力过硬之外,百度还占据“地利”。

首先,相比于谷歌的措手不及,中文搜索领域事实上存在缓冲区,并且目前,国内并没有能立刻补上对话AI+搜索应用这一空白的公司。

而且百度不仅占据中文搜索无可动摇的地位,还握有更懂中文的文心大模型,更有完整技术堆栈——近期市场上的稳定表现和反馈,也就都在情理之中了。

其次,在AI产业化落地进程中,百度一直扮演着排头兵的角色。在年初的百度AI开发者大会上,李彦宏还曾表示,真正的创新要靠产业实际应用中的“反馈”才能实现。

在国内,百度是第一批把大模型真正落地应用到产业当中的公司。比如国家电网,就和百度合作打造了电力大模型,以解决复杂自然环境中设备巡检等业务问题。在应对产业需求上,百度有着长期实践和第一手应用经验。这对于百度而言,其实也蕴藏着一个新的机会:文心一言不仅能够和百度搜索强强结合,在对外合作中,也更有可能直接给合作方带来应用价值。

所以从另一种维度看来,大语言模型创新、文心一言对于百度,与其说是市场竞争带来的压力,更像是一个AI时代的新机会,一个AI市场迎来爆发性增长和商业机遇中,给一个长期守望者和准备者,激励式的机遇。

更关键的是,在这轮机遇面前,百度可谓潮平岸阔风正帆悬。

在过往三年严峻大环境考验中,百度一手提升了健康经营度,展现了稳健态势;另一手通过组织调整和管理重组,建立了一个更高效的组织;而财报业绩,最能反映变革效果和当前状态。

财报业绩如何反馈?

百度交出了一份亮眼的财报,连续四季度业绩超市场预期。

2022年全年,百度实现营收1236.75亿元,归属百度的净利润(非美国通用会计准则)206.8亿元,同比增10%

第四季度,百度实现营收330.77亿元,归属百度的净利润(非美国通用会计准则)53.71亿元,同比增长32%

核心收入方面,2022年,百度核心收入为954亿元,与去年基本持平。但值得关注的是,其中非广告收入259亿元,同比增长了22%,占到核心收入的27%。

其中,AI驱动下的云计算和创新业务,正在展现出新增长引擎价值。

财报披露在2020年和2021年,非广告收入在百度核心收入中的占比分别为16%和22%——智能云带来的贡献相当突出,AI加持下的百度智能云,为行业提供标准化的解决方案,提高了利润率。

根据IDC报告,2022年,凭借云智一体的优势,百度智能云连续四年稳居AI云服务市场第一。另外,百度的智能交通解决方案,以累计合同金额超过千万元人民币订单计算,已经被69个城市采用,而且落地城市的缓堵保畅中发挥关键作用。2023年春节期间,保定、株洲、阳泉、重庆等多个城市,市内出行强度创5年来新高,而通行效率提升均达到15%以上。

除了将自动驾驶技术与大交通、云计算融合,在终端落地中,百度也巩固了全球最大的自动驾驶出行服务商地位。截至2023年1月底,萝卜快跑累计订单量超过200万。并且在全球“无人化”落地的关键分水岭中,百度完全无人驾驶运营取得了突破,开始在武汉和重庆提供全无人出行服务,并获准在北京开展全无人驾驶测试。

这种行业第一,百度财报还披露了两个:一是智能终端,小度在2022年前九个月,位居中国智能屏和智能音箱出货量第一。另一个是AI开发者平台,截至2022年底,百度飞桨平台开发者已经发展到535万,服务了20万家企业,同样位居中国深度学习市场应用第一。

所以确实如李彦宏所言,人类进入人工智能时代,IT技术的技术栈发生了根本性的变化。百度是全球为数不多、进行全栈布局的人工智能公司,从高端芯片昆仑芯,到飞桨深度学习框架,再到文心预训练大模型,各个层面都有领先业界的关键自研技术,可以实现端到端优化,大幅提升效率。

这种全栈布局,正是百度各项AI新业务业绩突出的核心原因,但知易行难,背后其实离不开马拉松式的坚定研发投入。

财报显示,2022年,百度核心研发费用达到214.16亿元,占百度核心收入的22.4%——这基本也是常态,百度的研发投入节奏,基本稳定在营收的20%左右。

实际上,百度还已经把这种对于技术投入和研发投入的坚定,写进DNA中。不管疫情前后,还是AI市场热情冷热不同的时期,李彦宏和百度上下对技术研发的信念没有发生过改变,在回港二次上市的演讲中,他就留下过金句:

有1块钱的时候,我们会投进技术里;有1个亿,我们会投进技术里;有100个亿,我们还是会投进技术里。

所以在这种始终热爱技术、愿意为长期投资、为未来投资的信念面前,“为什么总是百度”的问题,答案不言自明。

为什么又是百度?

生成式AI、大语言模型技术火了,当外界众里寻他千百度时,有人这样问。

为什么总是百度?

当自动驾驶展现创新变革,当AI基础框架面临断供担忧,当AI芯片被破圈热议,当人类全新技术创新周期里中国能否留有姓名……每一次关于技术和创新的讨论和提问中,又总有人从百度那里给出回答。

发生在技术领域的现象往往是这样的,每当新技术爆发、新风口出现,百度都会出现在种子选手名单中,且不是蹭热点、因为看见才相信,而是已经独自上路,孤勇探索已久了。

2012年开启的深度学习是这样,2013年上路的自动驾驶是这样,以及2010年就已经出发的自然语言理解研发也是这样——没有这种“江湖夜雨十年灯”式的提前出发,哪有生成式AI和大语言模型技术展现颠覆式影响时的枕戈待旦、最后一击。

如今,关于文心一言将带来的影响,正在被所有人看到和谈论。

比如搜索将被重新定义,除了提供更好的搜索和答案,还会带来全新的交互和聊天体验,以及独特的生成内容——一个新的流量入口正在被开启。

又比如与智能云协同,会改变传统云计算服务看算力、存储的旧习惯,会进入看框架好不好、模型好不好,以及模型、框架、芯片、应用之间的协同的新游戏规则。

以及人人受益的智能终端变革中,智能助手会更聪明、更善解人意,智能座舱会带来更加先进的人车交互体验。

所以此时此地,AI技术确实到了发展的临界点,商业价值的释放确实将前所未有、指数级增长。

百度确实也将毫无疑问获得时代红利中的最大回报,作为中国人工智能市场长期增长的最佳代表,站上浪潮之巅。

这令人嫉妒,也令人心悦诚服。

没有什么能保证我们所有人持续享受技术创新的红利,除了让敢于提前赌上一切开始技术创新的人,获得应得的奖励。

— 完 —

版权所有,未经授权不得以任何形式转载及使用,违者必究。