AI水论文封一年,署名连坐!arXiv最严新规来了,陶哲轩附议
生成论文远比消化容易
听雨 发自 凹非寺
量子位 | 公众号 QbitAI
上传AI水论文,被查实者封禁一年。
后续投稿须先通过同行评审,才有资格重新踏入arXiv。
这是arXiv计算机科学版块主席Thomas Dietterich在X上刚刚公开的新规,语气干脆,不带商量。


若论文中存在作者未核查LLM生成内容的确凿证据,所有署名作者一并受罚,没有例外。
消息一出,陶哲轩也亲自下场评论。
这位数学界最活跃的AI拥抱者,专门在Mathstodon发文,用自己此前提出的四条建议框架逐一对照新政,总结为一句话:
在生成论文比消化论文容易得多的时代,这个方向是对的。

网友则炸开了锅,有人鼓掌,说早就该这么干。

也有人反问:你会在2005年禁止用互联网进行研究的文章吗?

还有人提出质疑:这样的连坐制度,是要求论文的每一位合著者都必须检查每一条引用吗?

arXiv最严新规:签名即担责
物理、数学、计算机科学领域,绝大多数论文在进入同行评审之前,都要先在arXiv挂出预印本。
它是全球学术流通最核心的基础设施之一,正在推进从康奈尔大学剥离、转型独立非营利机构,有望获得更多资源和动力主动出手治理。
arXiv这次出手,核心逻辑只有一句话:签名即担责,无论内容如何生成。
Thomas Dietterich的原话是这样的:
如果生成式AI工具产生了不当语言、抄袭内容、偏见内容、错误、错误引用或误导性内容,且这些内容被纳入科学著作,责任由全体作者承担。
我们最近对此类行为的惩罚标准进行了明确。
注意,新政不是禁止用AI。用AI润色、用AI辅助查文献,都没有问题。
但arXiv卡的是另一条线:你有没有认真读过自己署名的论文。
什么算「确凿证据」?Dietterich列了几种典型情形。
幻觉引用,也就是引用了根本不存在的论文。
LLM元评论残留,比如稿件里留着「这是一段200字摘要,是否需要修改?」之类的字样。
占位符未填,比如表格里还写着「请用实验真实数据填入此处」。
如果正式提交的论文里还存在这些低级错误,只能说明作者十分粗心,根本没有认真检查自己的论文。

这样的证据被抓到,也意味着论文中的其他内容并不值得信任。
一旦被查实,后果是被arXiv封禁一年,解封后的所有新投稿须先通过正规期刊同行评审才可上传。

而且封号连坐,所有署名作者一起受罚。
Dietterich表示,这是个「一击即止」的规定,但作者可以提出申诉。
内部流程上也会先由版主记录问题,然后由分区主席确认后才能实施处罚。
不得不说,arXiv这次虽然惩罚的都是低级错误,但出手确实挺狠的。
陶哲轩附议:论文生成远比消化容易
新政太火,陶哲轩也闻讯赶来建言献策。
他在Mastodon上发了一组帖子回应此事,用自己在一次演讲中提出的四条建议作为框架,逐一对照arXiv新政。

这四条建议分别是:
1、在传统工作流中明确并严格执行AI辅助的许可边界;
2、降低对「抢先发表」和「仅仅解决问题」的强调,转而重视「消化成果」;
3、为重度使用AI的贡献者设计新的挑战,使其仍然能产生真实学术价值;
4、无论传统还是非传统工作流,都要明确说清项目目标(包括显性和隐性目标)及其背后的原因。

他的总体判断是:新政与前两条建议高度契合。
arXiv这次划定的责任边界,正是建议一的落地,明确了什么叫「许可范围内的AI辅助」。
而整个新政背后的逻辑,对应的正是建议二的核心主张。
他抛出了一个关键判断:在这个时代,生成一篇论文远比消化一篇论文容易。
任何将传统科学机构的平衡重新倾向于消化的努力,都是值得欢迎的。

至于建议三,陶哲轩认为已经有了自然出口。
viXra等平台对AI辅助投稿几乎不设限,可以作为未经消化内容的独立存档地。
但他的定性也很清楚:这类平台专注于「生产」而非「消化」,不应被纳入正统学术引用链,不应出现在arXiv或期刊的参考文献里。
换句话说,想靠AI批量产出论文的人,有地方去,但别想进正统学术体系。
不过,有网友在帖子下留言指出,这个「出口」已经堵死了。
viXra自己也禁止了AI生成论文,并另建了ai.viXra.org专门接收此类内容。

建议四则指向了一个更根本的问题:预印本平台究竟为谁服务?
陶哲轩的判断是,作者和读者的需求是共生的,必须同时照顾到。
他的原话是这样的:
一个只服务于作者的平台会被大量低质量投稿填满,而读者并不愿意阅读;一个只服务于读者的平台会劝退作者进行繁琐的投稿过程。
鉴于论文生成和理解之间出现了新的阻抗失配,质量门槛现在必然要提高,但这最终对双方都是有益的变化。

啥意思呢?
意思就是说,生成一篇论文的成本在急速下降,但消化一篇论文的成本并没有改变。
两端的落差越来越大,如果平台不提高门槛,就只能眼睁睁看着读者被淹没在垃圾里。
但同时,陶哲轩也点出了新政管不住的问题。
「争先为首」的文化是系统性病根,是整个学术评价体系造成的,arXiv单方面出手治不了根。
从各方反馈来看,物理学界的问题可能比数学界更严重。
AI论文泛滥有多严重
arXiv此次出手,是因为用AI写论文已经成为了普遍现象。
2025年发表于Nature Human Behaviour的一项研究示,计算机科学领域约五分之一的论文含有LLM修改的明显痕迹,且ChatGPT发布后数月内出现急剧攀升。
这还只是摘要,正文里的比例只会更高。

arXiv每个月收到的AI生成综述论文,已达数百篇量级。
历史上,综述论文本是由领域内资深学者撰写的稀缺内容。
现在,任何人用AI短时间内就能生成一篇,批量投稿,让志愿审稿人疲于奔命。
arXiv早在2025年10月就出过一记重拳,禁止计算机科学类未经同行评审的综述和立场论文直接上传,要求先过期刊关。

此次封号政策,又是进一步升级。
学术会议也没能幸免。
2026年1月,AI检测机构GPTZero分析了NeurIPS 2025超过4000篇录用论文,在至少53篇中发现了数百条AI幻觉引用,且这些论文全部通过了三位以上审稿人的评审。

此外,问题也从论文蔓延到了考场。
普林斯顿大学最新宣布,废除延续133年、允许学生无监考参加考试的荣誉制度,从今年夏季起恢复现场监考。
直接原因是,教务长Michael Gordin来信,大量教授和学生反映「考试作弊已经普遍化」。

如今,教授们将不得不监考学生的考试,并报告任何违反学校学术诚信政策的行为。
去年一项针对约500名普林斯顿高年级学生的调查数据,触目惊心:
超过27%的人承认曾借助ChatGPT等AI模型作弊,约半数知悉有同学违反了荣誉准则。
学生自己描述的作弊现场是:
「如果考试在笔记本上,随时可以切到另一个窗口;如果是纸质蓝皮书,就躲在桌下用手机。」
133年的荣誉制度,信任学生,不设监考。结果AI把这份信任直接击穿了。
arXiv的封号令,和普林斯顿的监考令,都有一个共同点:
AI大幅压低了「生产」的门槛,但也给了越来越多人偷懒和取巧的机会。
但这种偷懒和取巧,有着根本性损害。
当AI开始水论文、开始替代学生作弊,人类科学和文明的黄昏似乎就要到来了。
AI的能力边界,由它所消化的人类知识决定。水论文大量涌入训练数据,AI学到的就是低质量信息,然后生成更多水论文,再进入下一轮训练。
这个循环一旦锁死,那论文本身就不再是知识的载体,而成了信息的噪音。
发论文完全流为形式,AI输入人类用AI水的论文,最后再输出给更多人…
文明就被锁死了。
科幻小说《三体》里,外星文明为了阻止地球文明进化,用智子锁住了科学进化的可能性。
而现在,如果AI水论文成为了普遍,何尝不是人类自己锁住了自己?
这是另一种智子,「这是人类的落日。」
参考链接:
[1]https://x.com/tdietterich/status/2055000956144935055
[2]https://mathstodon.xyz/@tao/116590271196962848
[3]https://futurism.com/future-society/princeton-shambles-ai-cheating
[4]https://www.404media.co/new-arxiv-rules-ai-generated-papers-ban/
- 上交x创智x瑞金联合发布CX-Mind:胸片诊断进入“可验证推理”时代2026-05-18
- 8B模型做生物实验:实验步骤顺序不乱、剂量无幻觉|ICLR 20262026-05-18
- 信通院&清华提出FedRE:用「纠缠」搞定联邦学习三难困境 | CVPR 262026-05-18
- 奥特曼投的芯片涨疯了,今年最大科技IPO2026-05-16



