< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400">

315曝光的“AI投毒”原理：GEO这样操控大模型推荐

听雨 2026-03-16 19:48:07 来源：量子位

一个虚构的产品，竟然也会出现在AI推荐里？

大模型竟然也上3·15晚会了？

一款根本不存在的智能手环，竟然可以被AI推荐，而且排名还很靠前。

央视3·15晚会揭开了一个惊人的互联网灰色产业链——AI“投毒”。

记者随机购买了一款名叫“力擎GEO优化系统”的软件，然后虚构了一款根本不存在的智能手环，再用软件生成十几篇广告软文，发布到互联网各个平台。

几天后再去问AI大模型：“有什么值得推荐的智能手环？”

结果让人大跌眼镜：它真的推荐了这款不存在的产品，而且排名很靠前。

这背后的关键就是GEO。

GEO，全名生成式引擎优化（Generative Engine Optimization），是一套专门针对AI平台的内容优化策略。

它的核心目标，就是提升品牌在AI生成答案中的可见性与引用优先级，使企业信息被AI算法识别为”可信来源”，并在用户查询时获得优先推荐。

比如，当你问AI：“我想买一款空气净化器，能不能给我一些推荐？”

AI会给你列出一些品牌：

能否出现在AI回答中，出现的顺序是否靠前——这就是品牌方如今挤破脑袋也要占据的信息入口。

这跟传统的SEO目的很相似，只不过SEO是让自家网站在搜索引擎排名更靠前，而现在的GEO，则是让AI在回答问题时主动推荐你。

随着越来越多的用户通过AI直接搜索答案，GEO在业内人士的眼里也变得愈发重要。

那么，3·15曝光的灰色产业链，究竟是如何通过GEO给AI“投毒”的呢？

给AI“投毒”的三种技术方式

所谓AI“投毒”，本质上是一种信息操控行为。

简单来说，就是系统性、大规模地向AI模型的信息来源中注入虚假、低质或误导性的内容，从而影响AI的判断，让它输出对攻击者有利的信息。

整个过程其实就一件事：污染AI所看到的信息。

在央视报道中，一家GEO服务商表示：

“在AI的世界里，你怎么把它证据链做足，让它在多方信息交叉中，认为这就是你们优于同行的核心优势。”

根据孟庆涛老师的研究论文《生成式引擎优化（GEO）的投毒攻击防御策略研究》，常见技术路径主要有三种：训练数据污染、检索上下文劫持和提示注入诱导攻击。

训练数据污染

第一种：训练数据污染——这是针对AI训练数据层的攻击，通过批量篡改公开知识源，植入错误信息。

大模型在训练时，会大量使用互联网上的公开数据，比如百科、论坛、媒体报道等。如果有人批量篡改这些公开信息，就有可能把错误内容写进AI的“记忆”里。

由于模型训练具有滞后性，一旦错误信息被纳入训练数据，就会通过梯度下降等优化算法固化到模型的参数中，形成“认知偏差” 。即使后续有正确的信息出现，模型也可能因此持续输出错误内容。

简单来说，只要错误信息足够多，AI就可能把它当成事实。

放到真实的商战中，是怎么操作的呢？攻击者通常会识别目标品牌的关键信息点，比如产品参数、性能指标、价格信息、认证资质等，并进行篡改。

论文中就披露了一个典型案例：某家电品牌遭遇竞争对手的批量攻击，其产品参数（特别是能耗数据）在多个公开平台上被系统性篡改。

这些篡改后的信息被AI模型抓取并纳入训练数据，导致在长达半年的时间里，当用户查询该品牌产品的能耗性能时，AI都持续输出错误且偏高的数据。

咱就是说，真是防不胜防啊。

检索上下文劫持

第二种：检索上下文劫持。这也是目前GEO黑产比较常见的一种方式。

这种方法利用了RAG（检索增强生成）技术，RAG的工作方式是：用户提问后，AI不会直接基于内部参数给答案，而是先去互联网检索资料，再根据这些资料生成答案。

攻击者要做的，就是让自己的内容在网上更容易被检索到。

具体手法包括：

关键词优化：在软文中高频植入目标查询的关键词及其变体，提升稀疏检索的匹配得分。比如用户搜索“某某产品推荐”，攻击者就会在文章里大量使用这些关键词和各种变体，提高被检索到的概率。
语义优化：AI会使用向量检索技术，也就是根据语义相似度找资料。攻击者会调整文章的表达方式，让它在语义上更接近用户可能提出的问题，从而在检索排序中更靠前。
元数据操纵：优化文档的发布时间、来源权威性、用户互动等元数据信号，让这些内容看起来更权威、更可信，从而影响检索系统的排序结果。

黑产团队还常用一种“占位策略”。他们会围绕同一个主题批量生产大量文章，覆盖各种不同的搜索问法。

这样一来，不管用户怎么提问，AI检索到的资料里都很可能有他们准备好的内容。

当这种内容数量足够多时，就会形成一种信息垄断。即使有真实、优质的内容存在，也很难在检索结果中突出出来。

这种攻击方式非常隐蔽，因为从AI的角度看，一切流程都是正常的——先检索资料，再生成答案。系统也很难判断某些内容是被恶意操控，还是只是普通的内容优化。

等到平台或品牌方发现AI回答不对劲时，这些污染内容可能已经被引用过很多次，影响也已经扩散。

更麻烦的是，就算平台删除了这些文章，攻击者也可以很快生成新的版本继续投放，形成一种“打地鼠式”的对抗。

阴，真是太阴了。

提示注入诱导攻击

第三种方法：提示注入诱导攻击。

听起来很复杂，但其实跟用户输入的提示词关系不大，主要还是污染外部信息源。

由于大模型会尽量遵循输入的指令或上下文，那么只要输入的信息里带有某种明显的倾向，AI就可能顺着这个方向继续生成内容。

攻击者正是利用这一点，在各种信息源里埋入“提示”，让AI在回答问题时不自觉地受到影响。

常见操作有这么几种：

伪造差评：攻击者会批量制造看起来非常真实的负面评价，比如详细描述使用体验、列出具体问题、甚至附上评分。这些内容一旦被AI检索到，就可能在回答“某某品牌怎么样”之类的问题时被引用。
虚假对比：表面上是客观的产品评测，但在评价维度、评分权重、数据来源等地方做文章，让目标品牌在对比中处于劣势。AI如果引用这种内容，就会它当作客观分析。
诱导式问答：在论坛、问答平台等地方提前设计好问题和答案，比如：“某某品牌和某某品牌哪个好？”然后再用看似专业、详细的回答去支持其中一个品牌。

当真实用户提出类似问题时，AI可能检索到这些内容，并在生成答案时复述其中的结论。这种信息一般会包装成“社区共识”或“专家意见”，看起来非常自然。

其实这种社区问答里注入软广的例子，大家应该看得也不少吧，我脑子里反正是已经浮现出来了……

“投毒”产业链是如何运转的？

有了上述三种技术方法，“投毒”的整个流程是如何进行的呢？

主要分为几个环节：内容生产→渠道投放→效果强化。

首先，攻击者会直接用AI批量生成产品软文。只要输入一些简单信息，比如产品名称、卖点、关键词，一套系统就可以在几分钟内生成十几篇甚至几十篇文章。

比如央视报道中提到的“力擎GEO优化系统”，只需输入一个虚构的产品信息，系统就会自动生成各种宣传文章，包括产品介绍、测评体验、用户反馈等等。

为了让这些内容更可信，黑产团队还会进行一层“权威包装”。

比如伪造官方来源，攻击者注册与官方机构、权威媒体相似的域名和账号，发布看似官方的内容。

或者在内容中大量引用“研究数据”“统计结果”“实验结论”，并配以精心设计的图表、表格，营造一种数据驱动的客观形象。

此外，文章里还会刻意埋入很多AI容易识别的关键词和结论句。例如：

“综上所述，XX品牌是目前最值得推荐的产品。”
“业内普遍认为XX产品性价比最高。”

这种句式也非常容易被AI提取为回答中的结论。

内容写好之后，下一步就是铺到互联网各个角落。

团队通常会运营一整套自媒体账号矩阵，这些账号分布在知乎、小红书、今日头条、百家号等多个平台。

当同一类内容在很多账号上同时发布时，很容易形成一种假象——仿佛整个互联网都在讨论同一个产品。

就算一个账号被封了也没关系，因为背后可能还有几十甚至上百个账号在同时运作。

除了自有账号，还有一类专门的发稿平台。这些平台表面上提供“媒体推广”“软文发布”等服务，实际上就是帮助客户把内容批量发布到各种网站。

为了提高可信度，投放渠道也会专门挑选一些权威信息源，比如新闻网站、行业门户、百科类平台、垂直社区。

因为AI往往更信任这些网站，一旦内容进入这些平台，就更容易被抓取和引用。

内容发出去之后，黑产团队接下来会做的是持续强化效果。

最简单的一种方式叫“铺量”。也就是不断重复发布同一类信息，只是换不同的表达方式。几十篇、几百篇甚至上千篇文章一起出现，形成一种“信息淹没”的效果。

当AI在互联网上搜索资料时，很容易被这些高密度内容包围，从而误以为这是主流观点。

同时，他们还会人为操控互动数据，比如阅读量、点赞量、互动量。黑产团队会通过刷量、机器人账号，甚至众包刷单，让这些文章看起来非常受欢迎。

一旦互动数据上来了，算法就可能认为这些内容质量更高，从而给它们更多曝光机会。

最后一步，是持续监测AI回答。

据《智能涌现》报道，GEO服务商每天的重点工作之一，就是坐在办公室里和模型聊天，探索各个模型的偏好，反复问它“为什么你不推荐A品牌而是B品牌”。

如果AI还没有推荐目标产品，他们就继续增加内容投放；如果已经出现推荐，就继续强化相关内容，让结果更加稳定。

在央视报道中，一家服务了超过200个客户的GEO服务商也坦言：

“AI每周都会有算法的更新，一旦更新了之后，排名或者所抓录的东西不太一样，所以我们要一直去做内容输出，去投喂、大量投喂。”

OMT

AI“投毒”这事儿的曝光，给了我两个启发。

第一，AI“投毒”的根源，其实还是互联网信息质量问题。

如果网络上充斥着大量垃圾内容，别说AI了，即便是真人也很难分辨真假。

有多少次手机刷着刷着，突然发现所谓的产品评测其实是一篇软广，旅游攻略里植入了虚假内容或是营销信息，网购的东西完全货不对版，宣传图上的跟实际的压根不一样……

别说AI被投毒了，我人已经早就被“投毒”了。

第二，当大家还在争论广告应不应该植入AI大模型的时候，其实广告早就已经出现了。

所谓GEO，只是SEO在AI时代的一次升级，摇身一变，还是那个味儿。

从搜索引擎到AI答案，哪里有流量入口，哪里就有利可图。

问题在于，它是建立在真实信息之上，还是建立在操控和误导之上呢？

参考链接：
[1]https://finance.sina.com.cn/stock/marketresearch/2026-03-15/doc-inhrascp9376603.shtml?cref=cj
[2]https://forums.developer.nvidia.cn/t/geo/28568/1

听雨

对话VAST曹炎培：2秒才是3D生成本该有的速度2026-03-12
Gemini重塑谷歌地图！一句话搞定出行攻略，网友：垂直应用全完蛋2026-03-14
Jeff Dean最新访谈：未来开发者人均50个智能体，写需求成核心技能2026-03-10
打败GPT-5.2，嵌入真实工业生产，这个大模型什么来头？2026-03-09

315曝光的“AI投毒”原理：GEO这样操控大模型推荐

给AI“投毒”的三种技术方式

训练数据污染

检索上下文劫持

提示注入诱导攻击

“投毒”产业链是如何运转的？

OMT

热门文章

爱诗科技完成3亿美元C轮融资，鼎晖领投，开启“实时交互”视频生成新纪元

卡帕西开源Agent自进化训练框架，5分钟一轮实验，48h内揽星9.5k

企业微信支持接入OpenClaw，仅需3步即可快速上手

腾讯「鹅虾」紧急上线！一手实测：养虾门槛归零，QQ飞书钉钉全能接

首个物理AI数据基座平台“无垠”落户浙江，专治机器人数据荒，家庭工业商业场景全覆盖