今天是龙年的倒数第二天。
以往的年末,大家逐渐进入过年的气氛里,休息,总结,放松,过年。
今年的年末,却全然不是这幅景象。
DeepSeek R1 成为了现象级的焦点,没有人可以忽视它的光芒。
口碑爆棚,冲向第一
DeepSeek 的舆论热度和 APP 下载量持续走高,已经冲到了中国美国以及30多个国家的 App Store 第一名。
超越了小红书,超越了豆包,超越了红果,和其他所有应用。
要知道,这是春节前,各家大厂投放集中撒币的阶段。
要知道,它拿到的不光是中国区的第一名,还是30多个国家的第一名。
更令人惊讶的是,DeepSeek 没有市场部,也没做任何市场投放。
网上出现了一些质疑的声音:这家公司为什么买了这么多水军,到处都在尬吹?
但事实并非如此,这根本不是尬吹,也没有什么水军。
真实的情况,两个字,简简单单:
口碑。
冲刺,靠自己的技术实力,冲到和 OpenAI 齐头并进。
开源,把行业认知整体拉齐。
然后,得到全世界的尊重。
冲破 OpenAI 的阴影
从 ChatGPT 的发布,到现在的两年间,没有一家公司不是活在 OpenAI 的阴影里。
连去年大火的 Claude,在 B 端偷偷吃掉了 OpenAI 10% 的客户之后,也未曾冲到过美国 App Store 排行榜的前十。
而现在,一切都变了。
这一切变化,都要从七天前说起,那天晚上 DeepSeek R1 发布。
来自中国团队的开源模型,R1 效果比肩顶尖闭源模型 o1,而价格却只要其27 分之一。

彻底打破了推理模型价格昂贵的固有印象。
详见文章:一天两个大新闻,还过不过年了
这个模型不光是指标好,在实际的 AI 编程中效果也非常好。
论文里的革命性发现
之后的两天,大家开始看 DeepSeek R1 的论文,发现了一个更神奇的模型 R1 Zero。
R1 Zero 模型创新性地跳过了监督微调 (SFT) 阶段,直接采用强化学习 (RL) 进行训练,这种近乎原始野性的自进化方式,却取得了媲美顶尖模型的效果,令人惊叹。
模型虽然因为一些原因没有被公布出来,但它的研究结论却是革命性的:
模型的思考能力是可以自我涌现出来的。
在 DeepSeek-R1-Zero 的训练过程中研究员观察到的一个特别有趣的现象,那就是“顿悟时刻”的出现。

如图所示,这个时刻发生在模型的中间版本中。在这个阶段,DeepSeek-R1-Zero 通过重新评估其初始方法,学会为问题分配更多的思考时间。
「等等,等等。等等。这是我可以标记的一个顿悟时刻。
让我们逐步重新评估,以确定是否可以得到正确的总数 · · ·」
研究员激动地写道:“该模型学会使用拟人化的语气重新思考。这对我们来说也是一个顿悟的时刻。也让我们见证了强化学习的力量和美丽。”
X 上的一位之前曾在 Meta Google 做 AI 研究的朋友 Eric Xu ,这样这样评论 R1 Zero 的革命性:
这是一项有哲学意义的工作: 思考(或者说意识)真的是一个涌现现象,不是人类特有的,是模型通过针对一个奖励函数学习就能完成的。 这是往 AGI 上重要的一步

我们也可以相信,未来 R1 Zero 这样的纯 RL 模型一定有一天会出来,并且也许会成为未来的新范式。
所以我专门写了一篇文章,向所有人推荐这篇只有 22 页的论文。
详见文章:论文
开源的胜利
如果说 DeepSeek R1 的发布,意义重大,它证明了 OpenAI 是可以被超越的。
那 DeepSeek R1 的开源,意义就更大了。
它让几乎每家模型公司都可以复现 R1 的方法,并且都有机会超越 OpenAI。
著名投资机构 A16z 的创始人之一 Marc Andressen 评价 R1 ,说它是对世界的珍贵的礼物。

这是开源对闭源的历史上,又一次胜利。
算力限制下的突围
在这次的开源的伟大胜利中,中国的研究员,发挥了至关重要的作用。
在马斯克构建庞大的十万卡集群的时候,DeepSeek V3 仅仅使用了 2048 张卡。
在全球算力资源日益紧张,甚至面临算力出口限制的背景下,DeepSeek 的成绩更显得弥足珍贵。
它证明了,即使在资源受限的环境下,中国AI依然能够通过创新和开源,做出世界一流的成果。
中国的AI研究,依然可以为全球AI的发展贡献力量。
为何是 DeepSeek ?
DeepSeek 是相对神秘的一家公司。
在此之前,大家的注意力更多地聚焦在六小虎身上。
大家对 DeepSeek 的了解,大部分源于暗涌的访谈。
能够与 OpenAI 齐头并进的,为什么会是 DeepSeek?
也许我们能从访谈中略微看出一二:

这个世界存在很多无法用逻辑解释的事。
如果我们非要去解释,也许可以从中总结为两点:
- DeepSeek 靠组织和文化吸引了有才华的年轻人
- DeepSeek 靠开源开放吸引了社区的贡献者
那为什么 DeepSeek 能够吸引到这些年轻人和贡献者?
我翻出了去年去杭州和 DeepSeek 交流后所记录下来的笔记,也许也是一个注脚。

DeepSeek R1 对世界的影响
DeepSeek R1 发布两天后,竟然引发了美国科技界的恐慌情绪。
据 Meta 员工在匿名社交平台Teamblind爆料,DeepSeek V3 的出色表现已经让 Meta 内部感到震惊,仅花费550万美元训练成本的模型,性能却超越了Llama 4。
Meta全公司上下都在深入分析V3的技术细节,然而紧随其后的R1发布,更是让Meta感受到了前所未有的压力。

Sam Altman 被迫调整定价策略
第二天,x 上开始有人怀疑 DeepSeek 故意定价这么低,是为了降低 OpenAI 的利润,号召大家不要上钩。
还好美国科技圈大部分还是理智的,有人说R1是开源模型,自己跑一下就知道,它的成本还真就是这么低。
至于 OpenAI,20美金的月会员,一个月只能用200次 o1。
而 DeepSeek R1,同等水平,无限量,免费用。
面对这种情况,美国人也疯狂了。
从斯坦福到麻省理工,DeepSeek R1 都成了研究员的标配。

在英国的帝国理工,DeepSeek 也越来越火。

Sam Altman 急了,宣布即将推出的 o3-mini 可以免费使用,并且 Plus 可以大量使用。

而评论区,则是纷纷对 DeepSeek 表达谢意。

英伟达,或将面临冲击
DeepSeek V3 仅用了 2048 张 H800 就完成了训练,这种效率提升使市场质疑未来是否需要大规模采购英伟达高端GPU,导致英伟达股价短期内大跌超3%,市值蒸发超300亿美元。
训练侧似乎并不需要十万卡集群,那推理侧呢?
DeepSeek R1 因为其高性能,可以部署在华为昇腾上,顶级的自研开源模型+自主可控的硬件,就这样终于闭环了。
一直以来在GPU市场与英伟达竞争的AMD,也迅速宣布对DeepSeek R1和V3模型提供支持。

DeepSeek R1论文中还提到了一个值得关注的细节,即通过R1模型蒸馏得到的小模型,其性能也显著超越了同级别模型,这充分展现了端侧模型的巨大潜力。
因此,DeepSeek R1的发布无疑将对英伟达的市场地位带来一定程度的挑战,但具体影响程度尚待进一步观察。
因为一个顶级模型的开源,对未来的影响太大了。
开源的 R1 对未来的影响
最后,让我们聊一聊 R1 对未来的影响。
这个话题很大,值得重新写一篇文章进行讨论。
此刻,不妨做出一些基于当前趋势的合理推演:
- 很多团队开始复现 R1 和 R1 Zero
- 开源模型的进步将超越闭源模型
- 顶级模型的推理价格急速下降,技术更加普惠平权
- 开源模型的推理平台(如:硅基流动),将会在未来变得更加重要
- 模型通过 RL 继续增强能力,在推理、数学、代码方面几乎确定会达到 AGI
- AI编程将随着模型能力的提高,显著提升效率并降低门槛,有望持续拓展AI程序员的群体规模
- AI的创作能力将不断提升,在行文逻辑和文风模仿等方面逐步超越人类,从而催生更多AI创作的可消费内容形式
文章本来到这里就应该结束了,但我翻看梁文锋的访谈,注意到 DeepSeek 的研究员,大多数一些年轻人。

这些年轻人,选择加入 DeepSeek,一起做着一件「疯狂」的事情:
站在技术最前沿,挑战世界最强模型。
而在龙年即将结束的时候,他们做到了。
年轻人,是一个国家最宝贵的财富。
年轻人,是决定一个国家国运的关键力量。
龙年,马上就要过去,然而一切其实才刚刚开始。
蛇年,马上就要到来,我对 AI 技术发展的期待是八个字:
满怀希望,无限辉煌!
以上,就是今年为大家分享的所有内容。
感谢大家这一年的陪伴。
欢迎大家在春节期间把橘子汽水铺推荐给你的朋友。
如果不想错过更新,记得一定要把加上星标。
我们,明年再见!