< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400">

我嘞个豆！中国企业牵头，ICLR这场Workshop被挤爆了

一水 2026-04-28 19:15:02 来源：量子位

《近似算法》作者都来了

瓜多到一度吃不下的ICLR 2026，这几天终于在巴西开线下了！！

没去不要紧，最热闹最好玩的，咱都已经总结好了：

随机一个场景都有可能“掉落”LeCun这位巨佬NPC，学术追星人纷纷带着合照意满离；
热情桑巴给学术人带来亿点小小的震撼，本届开幕式被不少博士生评为“最嗨的一次”；
华人依旧是会场最活跃的群体之一，一天几场Oral展示环节，基本都是华人的主场。

不过当你以为这就完了的时候，一场主会之外的Workshop，才刚刚登场。

没错，现场直接被围到水泄不通。

而这群人聊的，不是多模态、具身智能或AGI这些热门方向，而是一个更底层的硬核问题：

机制设计与决策智能。

名字听起来有点“打脑壳”，但它做的事其实很实在——

直接决定推荐、广告、电商系统的顶层架构设计，是平台商业价值的核心驱动。

而且技术门槛也不低，需要打通经济学、博弈论和机器学习等多个领域知识。

更关键的是，这还是ICLR历史上首个聚焦该方向的Workshop。除了阿里妈妈这个牵头发起者，还集结了北京大学、MIT等一众顶尖高校。

这就很值得玩味了，一个能在顶会“开专场”、还把产业界和学术界的人全拽到一个房间里讨论到“上头”的方向，背后显然不简单。

这不得赶紧扒一扒咋回事（doge）。

一场被挤爆的Workshop，到底有什么魔力

Workshop可以简单理解成专题讨论会，通常不会是最挤的地方。但这次显然是个例外。

细究之下，离不开这三点。

No.1：话题足够前沿

机制设计和决策智能，这俩词，老实说第一次听基本都一脸问号，但它其实一点都不“小众”。

考古了一下，这是一个多次斩获诺贝尔经济学奖的领域——从1996年的维克瑞（William Vickrey），凭借在拍卖理论和机制设计领域的奠基性贡献，拿下诺贝尔经济学奖，再到2007年、2020年的得主，都在解决现实世界最核心的决策问题。

△诺贝尔官网

你刷到的广告为什么是这条而不是那条？短视频平台凭什么决定把10万的现金奖励发给哪个创作者？

这些看起来再日常不过的小事，背后其实全是机制设计和决策智能在跑。

简单说，机制设计就是定规则（游戏怎么玩），而决策智能是做选择（在规则下怎么赢）。

放在广告这个经典场景里：

机制设计是平台的活，决定排序怎么排、钱怎么收、广告怎么展示；

决策智能则是广告主的事，关心每次出多少、预算怎么花、什么时候加价。

两件事合起来，即为一个完整的博弈系统。

而这套系统，从PC互联网到移动互联网，一直在驱动最核心的商业引擎。

重要吗？当然重要。

但如果只是因为“重要”，可能在今天还不足以把ICLR的会议室挤爆。

放在当下，真正让全球顶尖学者坐不住的，其实还是AI：

机制设计和决策智能，正在被AI重写。诺奖级的老问题，正撞上AI时代的新解法。

△图片由AI生成

而这次Workshop所做的，就是把全世界正在重写这套游戏规则的人，凑到一个房间里。

No.2：嘉宾足够重磅

能担起“重写游戏规则”这一重任，想必你也猜到嘉宾们来头都不小。

扫一眼还真是，差点没忍住喊出声：我嘞个全明星阵容啊！

理论这头，两位坐镇者基本可以说是“祖师爷级别”。

首先登场的CMU教授Tuomas Sandholm，机制设计与博弈论领域无可争议的权威。

早年他带队打造的Libratus系统曾在德扑中击败顶尖职业玩家，而这次他又带着新系统Obscuro挑战比德扑更复杂的“Fog of War Chess”棋类游戏。

此游戏状态空间高达1018，但Obscuro不依赖离线训练，纯靠实时搜索，并刻意模仿人类“有限推理”（只保留8层认知深度），最终却以16:4战胜世界冠军，成为该领域首个超越人类的AI。

另一位是来自加州大学尔湾分校的Vijay V. Vazirani，做理论计算机的人绕不开的名字。CS博士大概率都翻过他那本《近似算法》。

他这次讲的是“基数效用匹配市场”，说白了就是一群人和一堆资源要互相分配（比如学生选宿舍、用户匹配商品），到底该用什么规则，才能既公平又有效率，还能真正跑得起来。

过去经济学家给出过一套很漂亮的方法（Hylland-Zeckhauser机制），理论上各种性质都说得通，但规模一大就开始“算不动”。

所以Vijay这次带来了一种基于纳什谈判（Nash bargaining）的新思路，既保留原本“好看”的理论性质，也保证在实际计算里能跑得动。

把这两位巨佬放在一起，能看出一个明显的趋势：理论这边，越来越关注“怎么在现实里跑得起来”。

顺着这一思路，上海交通大学的郑臻哲教授直接把问题推向了更复杂的AI战场：

当创作者开始博弈，创作者经济中机制设计的新问题。

以前推荐算法用的是“用户-内容”这套逻辑，但现在有了创作者这个新变量。

为了迎合平台规则，创作者往往会追热点、蹭标签、卡发布时间、复刻爆款。平台原本试图优化内容质量，结果却在不经意间，把问题变成了“创作者如何迎合规则”。

更麻烦的是，生成式AI又加了一层。

一个人可以用AI批量生产内容来参与竞争，这时候你甚至很难说：

平台是在和人打交道，还是在和一群AI打交道？原来那套算法逻辑是不是从根上就需要重写？

如果说郑臻哲抛出的是AI时代的“新问题”，那谷歌研究院的Song Zuo则给出了一个具体的“新解法”。

他关心的问题是：当广告创意都开始由AI生成，谁来决定哪个版本被你看到？

和传统广告拍卖不同，AI生成的内容是现产的，每次还不一样——东西都没出来，怎么拍卖？

Song给出的思路是：把出价的权力前置到生成过程里。

每个广告主只需要给出一个数字代表自己愿意出多少，模型在每个token往外吐的时候，根据所有出价综合考虑，决定下一个token怎么写、整篇创意往哪个方向走。

最后再用“维克里拍卖”这种博弈论中的经典防作弊机制来收钱——谁出价最高谁赢，但只需按第二高的价格付款，因此对广告主来说最划算的就是报真实心理价。

本质上来说，在AI生成内容的时代，拍卖的对象从“成品”变成了“生成过程”本身。

而更聚焦在产业侧的亚马逊广告高级首席研究科学家Niklas Karlsson，则是把业界真实痛点摆了出来：

如何在数十亿次决策规模的战略市场中，部署AI？

亚马逊每秒要做几百万次广告竞价决策，每个广告主又有自己的预算红线。怎么让AI在这个前提下既抢得到流量、又不花超预算、还能稳住模型——听起来像是不可能三角。

但Niklas说，有解，而且解法相当easy——分工。

一个负责猜：机器学习估出每次曝光值多少钱；
一个负责守：经典控制理论盯着预算红线，动态调出价。

如此一来，机器学习不需要把市场摸透，控制系统也不需要懂细节，各干各的反而最稳。

Anyway，虽然很多问题暂无答案，但至少这群顶尖大脑正在从不同方向找解法。

理论在补可计算性，AI在引入全新的变量，工业在解规模问题。

一幅关于机制设计与决策智能的未来图景，正慢慢浮现出来。

No.3：收录远超预期

而同样参与现场热烈讨论的，还有本次Oral Talk的5个论文团队（其实一共6个被评选为Oral论文，但来了5个）。

说实话，估计连主办方阿里妈妈都没想到投稿会这么火——

总共收到118篇，在顶会Workshop里算高产了，并且邀请了127位专家学者参与审稿。

别的不说，咱先看下Long Papers和Short Papers两个赛道各自诞生的最佳论文。

Long Papers最佳论文：

研究的是：当多家AI厂商同时争用户、用户偏好又五花八门时，怎么让模型真正对齐到每个人的真实利益？

结论很反直觉：不用靠强行监管或统一标准，市场竞争本身就会逼着AI越做越贴合每个用户——个性化本身就是一种对齐机制。

Short Papers最佳论文：

研究的是：让多个大模型一起参与“竞争”（比如定价、出价），它们真的会老老实实各玩各的吗？

结论也挺让人后背发凉：仅靠优化提示词，LLM智能体就会自发“达成默契”，在不显式通信的情况下默契抬高价格、不打价格战——AI市场的“算法合谋”风险，第一次被实打实地证实了。

而除了拿下Long Papers最佳论文的那篇，其余5篇Oral论文也都各有亮点。

第一篇：《Prices, Bids, Values: One ML-Powered Combinatorial Auction to Rule Them All》

一句话总结：通过提出机器学习混合组合拍卖机制MLHCA，让组合拍卖效率损失最多降到1/10，查询次数最多减少58%。

第二篇：《Decision Making under Imperfect Recall: Algorithms and Benchmarks》

一句话总结：智能体“记不住自己做过啥”的决策难题，第一次有了算法解法和评测基准。

第三篇：《AI Realtor: Towards Grounded Persuasive Language Generation for Automated Copywriting》

一句话总结：通过设计一套三模块系统（先挖卖点，再对齐买家偏好，最后做事实核查），成功让大模型给房子写销售文案既能吸引人，又不乱编。

第四篇：《On the Edge of Core (Non-)Emptiness: An Automated Reasoning Approach to Approval-Based Multi-Winner Voting》

一句话总结：投票理论里的一个老坑，被自动化推理工具撬开了。

第五篇：《Post-Training LLMs as Better Decision-Making Agents:
A Regret-Minimization Approach》

一句话总结：通过提出用“后悔最小化”做后训练，补齐了大模型在需要反复决策的场景中容易短视的短板。

而看完整场Workshop，想必你和我一样好奇——

能像桥梁一样连接工业界和学术界，并把专场开进ICLR，阿里妈妈凭什么？

答案，其实并不意外。

只需翻一遍它在机制设计、出价决策智能等方向的“奋斗史”，你就知道，这背后离不开它多年的技术深耕。

阿里妈妈技术深耕

如何准确形容阿里妈妈这几年技术升级的主线呢？

我想关键词一定少不了：AI化、智能化。

机制设计方面，从Neural Auction到CGA，阿里妈妈把广告拍卖这件事：

从“学会怎么排个序”，进化到了“直接生成整张最优广告页”。

传统的广告拍卖机制，比如GSP，本质上是给广告排序——出价高、质量好的排在前面。

但“排序”在数学上不可微（1就是1、2就是2，没有1.1这种中间态），所以AI无法通过梯度学习直接优化它。

因此很长一段时间里，这块主要靠经验规则撑着，学术界走得谨慎，工业界更是不敢让模型端到端地去学。

但阿里妈妈接住了这一棒。

通过提出Neural Auction，阿里妈妈率先给出了“可微的排序计算形式”，这项被学界评为“开创性尝试”的工作，正式打开了端到端学习拍卖机制的大门。

△图源：阿里妈妈公开技术博客

但问题并没有结束。

Neural Auction默认每个广告是独立的，但现实并非如此——

一条广告放在哪个位置、周围是什么广告、同页结构如何，都会影响点击与转化。

这种“排列之间的相互影响”，传统排序模型无法刻画。

于是阿里妈妈进一步换了一个更彻底的思路，做了生成式拍卖（CGA）：

不再一条一条地排广告，而是让模型一次性生成整一页广告的最优排布方案，把“怎么排+怎么定价”一起学掉，用一个生成模型去直接拟合整个页面的最优解。

在大规模A/B实验中，CGA不仅显著提升平台收入，也在效果上逼近理论最优拍卖。

后来这项工作还直接被KDD 2025 Research Track接收了。

而这种“用生成式模型一次性搞定全局最优”的思路，也延伸到了智能决策领域。

△图源：阿里妈妈公开技术博客

智能决策核心解决的是广告主怎么出价、怎么赚钱。

过去十年，这件事大致走了三步：从简单规则控制（PID），到用强化学习试着自动调，再到引入更复杂的模型，但结果始终不理想。

这背后核心卡点只有一个——反馈太慢。

广告投放不是下棋，走一步马上知道输赢。广告主投一笔钱，要等几个小时甚至几天才知道ROI是多少。标准RL在这种环境下，学得慢、波动大，所以上线就翻车成了常态。

因此在2023年，阿里妈妈做了一件学术界没人做、工业界更没人敢做的事：

通过提出AIGB（AI-Generated Bidding），把“出价”这件事，重新理解成“生成最优策略”。

以前模型靠反复试，而AIGB是根据广告主的预算和ROI目标，一步一步“生成”一整条出价曲线。

后来在AIGB的框架下，阿里妈妈研发了基于扩散模型的DiffBid，让出价过程变得更平滑稳定。

在自家广告平台实测中，DiffBid能把GMV提升3.6%–5.0%，而且出价曲线更平滑，不会出现“上半场把钱花光、下半场干瞪眼”的情况。

而沿着AIGB这条线，阿里最新的工作AIGB-Pearl，又在“生成”之外加了一只眼睛：

让模型不仅能生成出价策略，还能反过来评估自己生成的策略好不好，再迭代优化。

（这篇论文也被ICLR 2026接收了）

不过还是那句话，如果只是闷头做技术，是开不出ICLR专场的。

技术之外，阿里妈妈这两年在做一件更费劲但更关键的事：把自己做出来的东西逐步开放出去。

我们目前看到的，阿里妈妈举办的各种比赛以及开源，本质上都是它为了开放而做出的努力。

比如在2024年，他们成了唯一一个拥有NeurIPS比赛主办权的国内工业团队，还专门设了AIGB相关赛道，让全球研究者在同一个问题上做对比和竞争。

同时也开源了AuctionNet这类大规模模拟竞价数据和系统，解决了一个长期问题：以前做拍卖机制研究，大家手里基本没有真实工业数据，只能靠模拟和假设。现在至少有了一套相对标准的“练习场”。

再加上这次在ICLR开Workshop。

到这里，阿里妈妈的角色，已经从“闷声做技术”的应用方，变成了这个领域的基础设施提供者。

学术圈拿到的是数据集、比赛、Workshop；工业界拿到的是真实的业务收益、可复用的范式、能上线的方案。

而把两边连起来的，是阿里妈妈自己。

ICLR2026 阿里妈妈

一水

突发，翁荔离职Thinking Machines2026-07-28
陶哲轩在菲尔兹颁奖现场：数学迎来百年新危机2026-07-27
机器人为啥困在Demo？讯飞新公司爻方智能给出答案：缺一味「本体认知」2026-07-23
看了20万小时「人类干活实录」，机器人悟了2026-07-19

我嘞个豆！中国企业牵头，ICLR这场Workshop被挤爆了

一场被挤爆的Workshop，到底有什么魔力

No.1：话题足够前沿

△诺贝尔官网

△图片由AI生成

No.2：嘉宾足够重磅

No.3：收录远超预期

阿里妈妈技术深耕

△图源：阿里妈妈公开技术博客

△图源：阿里妈妈公开技术博客

相关阅读

北京说Agent已经能造世界，杭州却说它是刚发明的电灯泡

别Claude Code了，一个国产免费命令行就够了

AI驱动下，品牌高质增长成破局关键丨阿里妈妈未来商业奖颁奖盛典落幕

专门聚焦AI的产学研基金来了！CCF阿里妈妈合作，第一期大模型

KDD'25 | 生成式拍卖：感知排列外部性的整页优化机制

大模型浪潮迈入新阶段：从Pretrain到SFT | CCF C³

热门文章

智能体政策新闻相关背景和简要解读

合肥又押中AI独角兽：多模态赛道，3个月融了21亿

国产世界模型登顶李飞飞团队榜单！适配国产昇腾算力、代码权重全开源

长内容创作者苦AI失忆久矣，这个新Agent漂亮填坑！门槛低到只需要会用键盘打字

世界模型“六小龙”在WAIC吵起来了！行业红利就在非共识里