不读博士,照样进OpenAI!o1核心成员现身说法了

进OpenAI,并不一定要博士学位

henry 发自 凹非寺

量子位 | 公众号 QbitAI

如果没有PhD,是不是就和前沿AI研究没关系了?

至少在Noam Brown看来,未必。

这位OpenAI 研究员、o1的核心贡献者,刚刚分享了一串“非典型研究员”的经历。

有人没有论文、有人没读研、有人白天在麦肯锡上班,晚上在GitHub写研究。

还有人没事就在推特发帖、GitHub上提问的。

他们后来都去了哪?

OpenAI、DeepMind、Anthropic。

进OpenAI,并不一定要博士学位

在这篇长帖中,Noam分享了Keller JordanSholto DouglasAndy JonesKevin Wang等一批“非典型”研究员的经历。

总体看下来,他们都有一些相同的特质。比如,主动性极强(热爱)、公开研究,不闭门造车、工程能力在线、会PR、不执着于头衔。

接下来,我们具体来看。

Keller Jordan:套瓷研究+推特学术

首先被Noam分享的,是Keller Jordan

他现在在OpenAI,从事预训练相关的研究。而他的研究生涯,某种程度上,起于一段典型的“套瓷研究”。

Keller只有本科学位(UCSD),也没有任何论文发表经历。

毕业后,他先进入了一家做 AI 内容审核的初创公司工作。

在工作之余,他并没有闲着。

Keller主动联系了当时还在谷歌的Behnam Neyshabur,并向他展示了一个针对Behnam最近论文的改进想法。

或许是出于“有人真的认真读了我论文”的成就感,Behnam同意指导他。

最终,他们与其他作者一起,完成了一篇入选ICLR 2023的论文。

对于Keller这种“套瓷+研究”的方式,Noam评价说:

遗憾的是,如今公开研究的空间比以前小了,但在已有论文基础上提出改进,依然是向实验室内部研究员证明你能力的绝佳方式,也能让对方有信心去帮你争取一次面试机会。

后来,一篇2024年底写下的一篇博客Muon: An optimizer for hidden layers in neural networks,则真正为Keller拿下了一张去OpenAI的船票。

(注:Muon是专门用于神经网络隐藏层的优化器,核心思想是把常规梯度更新“正交化”)

当时,Keller发起并持续更新了一个NanoGPT speedrun:

这个实验是在Karpathy的NanoGPT框架下,系统性地比较不同训练配置和优化器,目标是把预训练速度推到极限。

而Keller自己倒腾出的Muon,正是在这一系列speedrun实验中,脱颖而出。

这引起了大神Andrej Karpathy的关注,Keller也因此进入了OpenAI的视野。

而后续进入OpenAI也是顺手推舟。

这种把研究直接摊在GitHub 上、同时在社交媒体上持续记录的方式,一方面让他的研究水平和产出变得异常容易衡量;

另一方面,也让这些工作没有淹没在arXiv的论文海里,而是被真正看见,并最终得到了圈内大神的认可。

说到底,PR太重要了!

Sholto Douglas:在GitHub上提问吸引大佬注意力

接下来,Noam又分享了现Anthropic研究员Sholto Douglas的故事。

Sholto Douglas曾经就职于谷歌,是Gemini项目的重要推手之一。

而他,也只有本科学位。

(没错,他还在清华交换了一年)

Sholto本科学的虽然是机器人,但毕业后却进了麦肯锡工作。

而这,很大的一部分原因是,Sholto没有申请到想去的研究生项目。

由此,Sholto索性干脆一边上班,一边做研究。据Sholto在播客中的分享,他几乎是:

每天晚上10点到凌晨2点,周末每天至少6到8个小时,全都在写代码、做实验、搞研究项目。

在学习过程中,Sholto还经常在Google开源的机器学习框架JAX的官方GitHub仓库上提问。

而这,引起了当时在谷歌,现在在Anthropic的James Bradbury的兴趣。

James心想:这世界上还有我不认识的隔这提问的人?

于是,在看到了Sholto的提问以及他平时做的项目,James就主动联系他,并邀请他前往Google DeepMind的面试。

最终,本科生,第一段工作完全不AI的Sholto进入了谷歌。

有趣的是,在进入谷歌之后,Sholto才发现,自己被招进来,其实在某种程度上是一个内部实验

试试看,能不能把一个热情和主观能动性极强的人,和他们认识的最优秀的一批工程师配对,看看会发生什么。

andy jones:自学软件工程和机器学习,自费发论文

andy jones现在是Anthropic的研究员,负责的RL基础设施、沙箱系统,牵头多模态方向,以及参与大模型训练。

在此之前,他是一位半退休的量化分析师。

和上面几位一样,andy有极强的主动性:他自费租赁算力,自费发表论文

在论文《Scaling Scaling Laws with Board Games》中,andy不仅首次系统地量化train与test compute的tradeoff。

还在测试时计算扩展成为热门概念之前,比较了扩展预训练和扩展测试时计算的影响。

这篇论文直接让他成为机器学习领域的炸子鸡。

而后来,这一研究还直接推动了o1等模型的测试时计算范式,并被Noam放入了o1的技术报告里。

而据一位网友的补充,andy的经历并不止如此。

他在英国完成了4年制的数学硕士,并且花9个月时间自学了软件工程和机器学习。

后来,他又干了一年的生物信息学研究。

再后来,3年的量化交易工作已足以让他财富自由。

尽管如此,andy并没有停下,而是完成了一系列独立探索,并最终进入Anthropic。

Kevin Wang:进入OpenAI的本科生

此外,Noam透露,像OpenAI这样的实验室,确实会直接从本科阶段招聘研究员。

Kevin Wang就是其中一。

2025年,Kevin Wang在完成本科学习后,直接进入OpenAI,从本科生一步跨入一线研究团队。

这并不是一次“破格的运气”。

一方面,Wang拥有导师的强力推荐;但更关键的是,他本身就握着一篇极其扎眼的论文。

对于OpenAI来说,顶会上“水平还不错”的论文并不稀缺。
真正稀缺的,是那种在第一眼就能被挑出来的工作。

Noam回忆,在NeurIPS 2025的5290篇论文中,他们几乎是一眼就注意到了Wang的研究。

而后来的结果,也验证了这个判断——

他的第一作者论文《1000 Layer Networks for Self-Supervised RL: Scaling Depth Can Enable New Goal-Reaching Capabilities》,最终拿下了NeurIPS 2025最佳论文

谈到招聘标准时,Noam 也给出了一个很现实的评价:

导师的推荐分量很重。因为仅凭简历,甚至只看论文,本身就很难全面评估一名研究员的真实水平。

最后,Noam也分享了自己对“薪酬”的看法:

关于“薪酬”这件事:我认识一些人做量化是为了赚钱,但五年之后却开始反问自己——我到底在用人生干什么?

我们正处在一个非常特殊的历史时刻。做AI研究,你既有机会积极参与并引导这个时代最重要的技术发展,同时收入也相当可观。

我本科毕业后在量化交易行业干了一年,但并不希望自己此生对人类的“贡献”,只是让股票市场稍微更有效率一点。

后来我选择降薪转去做 AI 研究——这是我这辈子做过最好的决定。放在今天,你甚至不需要降薪,也能走上这条路。

早进厂,没啥问题

除了Noam的分享以外,现在可能越来越明显的一点是:

想把研究做好、想进前沿AI大厂,博士学位本身,似乎已经不再是必需品了。

比如,GPT论文的一作、CLIP的一作Alec Radford,就是本科出身。

而现在OpenAI的首席研究员Mark Chen,也只有本科学历,一开始做的甚至还是量化交易。

在 Noam 那条帖子下面,有网友一针见血地总结过:

一条很棒的长帖,讲的是没有PhD学位的人,是如何进入前沿AI实验室做研究的。
PhD能给你导师和同行圈子,但它并不会自动赋予你好奇心、主动性,或者研究品味。

上面提到的Keller就是一个典型例子。

他是在完全公开的环境里做出了Muon优化器,实验过程、结果都直接发在推特上。

甚至没有论文,只有一篇博客。

但影响力不言自明——现在OpenAI、Kimi、DeepSeek都在使用它。

类似的故事并不少见。

比如Stability AI的80名研究员和工程师中,只有16位拥有PhD,而且其中相当一部分是直接从推特上招来的。

换句话说,你不需要 PhD,才能成为一名优秀的研究员或工程师。
你只需要真的去做事,而且让别人看得见你在做什么。

前几天刚上《WhyNotTV》的嘉宾——

从GPT-3.5到GPT-5都有深度参与、负责GPT post-training RL infrastructure的核心成员翁家翌,也是只有硕士学位。

在播客里他也提到:相比去读一个 PhD,尽早进入工业界比较好

因为等PhD读完,研究范式可能已经换了一轮;

而且博士阶段往往面对的是toy benchmark,而不是真实世界的系统和约束。

与此同时,很多AI Lab真正短缺的,反而是工程能力极强的人

至于能不能进、进了之后做什么,很大程度上取决于:实验室当下需要什么,以及你是否已经在过往经历中证明过自己能补上那块拼图。

参考链接
[1]https://x.com/polynoamial/status/2014084431062114744
[2]https://www.youtube.com/channel/UC5xLV_gJAP9psKcyrJ3ZIcw
[3]https://www.marketingaiinstitute.com/blog/the-marketing-ai-show-episode-74
[4]https://www.dwarkesh.com/p/sholto-douglas-trenton-bricken

版权所有,未经授权不得以任何形式转载及使用,违者必究。