Claude Mythos让梁文锋决定融资
DeepSeek不储备弹药根本没法打下去了
梦晨 发自 凹非寺
量子位 | 公众号 QbitAI
什么是DeepSeek开启融资的直接导火索?
The Information最新消息曝光:梁文锋看到Claude Mythos通过海量算力和数据训练出超强能力,意识到DeepSeek不储备弹药根本没法打下去了。
Anthropic今年4月发布第一个预览,DeepSeek融资传闻也是4月中旬第一次传出。
时间线,刚好对得上。
DeepSeek三百人团队要翻倍
融资完成后,DeepSeek本周四罕见地发了一则公开声明:
所有部门招人“至少翻倍”,覆盖AI系统开发、基础设施、产品开发和深度学习研究。
目前DeepSeek全公司约300人。
其中负责把模型转化为自主AI智能体的核心部门 Harness团队,已经进入每天面试的状态。
该团队负责人崔添翼今年3月从Jane Street跳槽加入,本月早些时候在X上透露了这一节奏。
与此同时,DeepSeek正在加紧适配国产芯片,梁文锋相信华为芯片几年内就能追上英伟达的水平,DeepSeek应该率先完成适配。
华为去年才得知DeepSeek在私下试验自家芯片后,开始与其直接合作。
但适配的代价不小。
DeepSeek的训练和部署系统是围绕英伟达CUDA软件搭建的,工程师必须重写底层软件才能让模型在华为芯片上高效运行。
这直接导致DeepSeek长达15个月没有发布任何新一代模型,在其他顶级实验室两三个月就发一次新模型的时代,这个空窗期格外扎眼。
这也让DeepSeek错过了去年下半年Anthropic Claude Code掀起的编程工具热潮。
但梁文锋在路演中对投资人说,编程工具和AI聊天机器人一样,都只是AI进化中的临时产物,如果重注押在这些短期产品上,会偏离通往AGI的终极目标。
“AI不应该被少数人控制”
最新爆料还指出,梁文锋并非一开始就抗拒风投。
2023年他确实见过投资人,但当他告诉对方DeepSeek只做深度研究和科学探索、没有任何商业化或产品路线图时,投资人纷纷打了退堂鼓。
最后梁文锋自己掏钱养活了这个实验室,一养就是三年。
这次74亿美元的融资中,梁文锋自己写了最大的一张支票:200亿人民币(约30亿美元),占总额的五分之二。
融资完成后,DeepSeek设立了员工持股计划,按实际估值分配股份。
梁文锋告诉身边人,他的战略不会变:继续开源、保持低价、专注AGI。他把AGI定义为机器在理解、推理、学习、规划和适应等广泛任务上达到人类水平。
他还告诉身边人,AI不应该被少数人控制。
DeepSeek是目前唯一一家将所有模型底层代码完全公开的主要AI实验室。
在美国开发者群体中,DeepSeek的存在感正在急速膨胀。今年4月发布的旗舰模型V4,5月在Vercel的AI Gateway平台上token用量份额从不到1%飙升至17%,一个月内成为该平台仅次于Anthropic和Google的第三大模型。
轻量版V4 Flash的价格比Anthropic模型便宜20到50倍。
这种增长在6月仍在继续。
- 太空算力的国产答案:用光子更高效!马斯克和老黄都太绕了2026-06-29
- AI硬件席卷618,钉钉A1包揽天猫、抖音、京东销量冠军2026-06-22
- Agent时代,华为云开始重新造地基了2026-06-15
- Token贵只因你喂给模型的垃圾太多了丨@亚马逊王晓野AIGC20262026-06-01



