梁文锋终于低头,DeepSeek首轮融资曝光

李迎
2026-05-07 10:11

梁文锋不是神,向现实低头不丢人。

这两天,投资圈彻底炸了。

有知情人士爆料,AI明星公司DeepSeek正式启动成立以来的首次外部融资——目标估值不低于100亿美元,计划募集至少3亿美元资金。

而众所周知,就在一年前梁文锋还明确拒绝过VC投资,并对外表示“DeepSeek暂无融资计划”。

当时,有知名投资者找了三拨人想约见,被拒绝;甚至与DeepSeek北京办公室同楼办公的百度风投也没能投进去。

那个曾经把所有投资人挡在门外的梁文锋,为什么突然要钱了?

图片

“从不融资”已是过去

消息一出,讨论立刻分成了两派。

一种说,完了,连DeepSeek都顶不住AI烧钱的压力;另一种说,AI圈要变天了,梁文锋这是要憋个大的。

但如果你只看到“缺钱”两个字,就把梁文锋和这件事看小了。

据悉,2023年7月,当DeepSeek正式成立之时,梁文锋从第一天就给这家公司划了一条清晰的红线:不接受外部融资,不稀释股权,不被任何人的商业化时间表绑架。

他确实有这个底气。梁文锋是幻方量化的创始人,而幻方是国内顶级的量化对冲基金,管理规模超700亿元,2025年平均收益率高达56.6%。

早在2019年,他就花2亿元自研了深度学习训练平台萤火一号,两年后又砸10亿元建萤火二号,大批采购英伟达A100,把幻方做成了国内屈指可数的万卡集群公司。

有量化基金从业者估算,仅2025年一年,幻方就为梁文锋带来了超过7亿美元的收入。

有钱、有卡、有人,这就是DeepSeek长期拒绝融资的底气。梁文锋说得也很直白:VC都是帮LP管钱,都得赚钱,所以就谈不到一块去。

然而,在过去一年里,这个防火墙似乎被逐渐击穿了。

当下,AI大模型的竞赛,已经到了决胜期或决胜期前夜。

3月31日,OpenAI刚以8520亿美元的估值完成了1220亿美元的融资。Anthropic在2月以3800亿美元估值完成300亿美元融资。

国内同样在加速,智谱AI已于1月登陆港股,IPO前完成8轮融资、累计募资超83亿元。月之暗面Kimi更是在短短数月内先后完成多轮融资,估值已突破100亿美元。

当身边的竞品都在用市场化手段绑定人才、储备算力,梁文锋还能坚持多久?

图片

图源:X

半导体研究机构SemiAnalysis曾估算,DeepSeek的服务器总资本支出接近16亿美元,其中9亿多直接和运行计算集群相关。而越往顶尖走,每往前追一步,边际成本就越高。

从15秒跑到13秒,多练练就行;但从10秒跑到9秒9,每提升0.1秒,都要付出几倍的努力和成本。这不是靠一家量化基金的利润就能无限支撑的。

此外,不少人认为DeepSeek曾经的优势,在于对英伟达芯片的深度绑定和调教。

与多数依赖规模堆叠的大模型不同,DeepSeek是从“效率”入手,通过一系列算法与工程优化,实现了接近SOTA水平的性能,同时大幅压低成本。

但这种效率,一方面建立在梁文锋早年量化交易积累的大量英伟达GPU资源之上,另一方面也深度依赖英伟达的CUDA生态。

一旦出现供应链限制,整个公司的研发、训练、推理都可能受到严重影响。而当前美国对高端芯片的出口管制持续收紧,英伟达最新一代Blackwell芯片的获取存在一定限制。

多重压力叠加之下,不是梁文锋想通了,是他不得不通。

图片

DeepSeek V4背后,梁文锋的野心彻底暴露

很多人盯着融资的数字,却忽略了这次事件里最影响行业格局的一件事:DeepSeek即将发布的V4模型,正在全力从英伟达的CUDA生态向华为昇腾芯片迁移。

结合前面所说,V4的技术野心,远超外界想象。

根据目前披露的信息,V4的参数规模跃升至万亿级别。它采用MoE架构,总参数约1万亿,但每个token仅激活约370亿参数,推理成本几乎与V3持平——这个设计思路延续了DeepSeek一贯的效率优先哲学。

上下文窗口扩展到100万token,并引入了一套名为Engram的条件记忆架构,实现超长上下文的恒定时间检索。据内部测试,在100万token长度下的信息召回率达到97%,远超V3在128K上下文时的表现。

更重要的是,V4将是DeepSeek首个原生多模态模型,支持文本、图像和视频生成。此前DeepSeek的模型一直以纯文本为主,而其他旗舰模型早已拥抱多模态。

据悉,该模型代码能力也被大幅强化,内部benchmark显示SWE-bench成绩超过80%,HumanEval达到90%,据称V4能处理整个代码仓库级别的复杂bug修复。

此外,V4预计将分两个版本发布:完整版超万亿参数,面向华为昇腾芯片;轻量版约2000亿参数,面向通用对话和API服务。

当然,行业的关注点不会停留在模型本身。

DeepSeek V4对华为昇腾算力生态的深度适配,大幅降低了对英伟达生态的依赖。这件事的意义之大,以至于英伟达创始人黄仁勋在近期采访中公开表达了关注。

外媒爆料,黄仁勋私下表示,“如果有一天DeepSeek先在华为芯片上发布,那对我们来说将是一个可怕的结果”。

当然,这条路并不好走。与英伟达CUDA生态的深度绑定,使得切换国产芯片需要“重写”大量核心代码,迁移成本高昂。

据多家行业媒体报道,DeepSeek原计划今年2月发布V4,但因工程问题多次推迟,团队正在投入大量精力进行适配迁移工作。这也是DeepSeek已有15个月没有大版本更新的重要原因之一。

然而,这件事一旦做成,意义将远远超出DeepSeek自身。

它将成为全球第一个不依赖英伟达的顶尖AI大模型,为中国AI产业链的自主可控提供一个重要的技术支点。

从这个角度看,梁文锋的融资,买的是算力,更是一个生态自主的机会。

图片

融资的深层逻辑

那么,除了这些,融资的真正意义是什么?

首先,融资解决了期权定价的问题。

DeepSeek此前一直没有进行大规模市场化融资,公司估值没有明确的市场标尺,团队成员手里的期权价值缺少清晰的参照。

这次融资,通过市场化方式给公司定了估值,本质上就是给团队搭建了合理的长期激励体系。这比给员工涨工资更重要——在AI这个高度依赖顶级人才的行业,没有市场化的激励机制,留人就是一句空话。

其次,融资为V4的研发和部署提供了弹药。

V4要实现万亿参数、适配国产芯片、做到原生多模态,每一项都是烧钱的大工程。虽然幻方量化持续为DeepSeek供血,但AI大模型竞赛的本质已经变了——这不是接下来一两年可以结束的,未来三年有可能争出个分晓。

梁文锋这次启动融资,核心就是为了长期研发储备充足的算力弹药。

第三,融资开启了商业化的通道。

DeepSeek的开源路线决定了它的商业化路径必须走差异化。闭源玩家的商业化路径更清晰,但DeepSeek必须通过API调用和企业定制来变现。

而企业级客户,尤其是政府客户和大型国企,选择AI供应商时,看的不是技术指标,而是资质和背景。

本轮融资如果引入国有资本,意味着DeepSeek可能获得政府AI项目的优先供应商资格;美元基金入场,则为国际化扩张铺平了资质道路。

但融资也带来了一个无法回避的问题:DeepSeek正在从一家“例外”走向一家正常的商业公司。

过去DeepSeek最特殊的地方,恰恰在于它不像一家典型AI公司。它背后有幻方量化供血,梁文锋不急着融资,也不急着把公司推上估值、商业化和资本退出的流水线。

DeepSeek对自己的定位,与其说是一家商业公司,不如说更像是一个完全独立于资本市场而运作的开源研究机构。

但今天的AI竞争已经不是单点模型能力的竞争了。

字节有豆包、有即梦,阿里和腾讯开始把世界模型推到台前,智谱、MiniMax已经登陆港股。

如果只看DeepSeek至少100亿美元的估值,它当然还是一家很贵的AI公司。可放在今天的中国AI坐标系里,智谱、MiniMax在港股高点的市值都曾突破3000亿港元,月之暗面最新估值已经达到了180亿美元。

DeepSeek过去可以靠技术理想和开源声望行走江湖。但当行业从技术竞赛转向生态和商业化竞争,一家公司终究需要治理结构、估值体系、薪酬激励、商业化收入和长期预算。

研究理想可以继续存在,但公司终究要面对现实。

不是理想不好,是现实太贵。算力成本在涨,人才价格在涨,竞争对手的估值在涨——当所有生产要素都在涨价,技术理想主义本身也在涨价。

梁文锋用三年时间证明了一件事:用更少的钱可以做出很好的模型。但现在他需要证明另一件事:用市场化的方式,能不能让这家公司走得更远。

毕竟,AGI不是靠理想就能抵达的。

1、该内容为作者独立观点,不代表电商派观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
DeepSeek首轮融资有了新消息,曝国家队入局领投。
刘强东被梁文锋拿下
市场近期曝出DeepSeek 首轮融资或已敲定,京东直接出手30亿元。
4月18日消息,消息称,两名知情人士透露,中国人工智能初创公司DeepSeek正在与投资者洽谈,计划以100亿美元的估值筹集至少3亿美元资金,此前该公司曾拒绝了中国顶级风险投资公司和科技巨头的多次融资提议。这家公司去年凭借其低成本模型席卷了人工智能行业,并震动了股市,据多位知情人士透露,DeepSeek创始人梁文锋近日在内部沟通中称,新一代旗舰大模型DeepSeek V4将于4月下旬正式发布。
6月16日消息,据消息,DeepSeek已完成首轮融资,募资总额超500亿元人民币(约合74亿美元)。梁文锋是最大出资方,个人投入200亿元;腾讯出资100亿元;宁德时代出资50亿元;京东、网易、风投机构IDG资本各出资30亿元。本轮融资后,DeepSeek估值约为3380亿元人民币(约合500亿美元)。此轮融资采用了一种不寻常的结构,赋予投资者经济权益,但没有投票权,以此保障梁文锋对公司拥有绝对控制权。
5月6日消息,据消息,国家集成电路产业投资基金 正在与DeepSeek洽谈主导其首轮融资事宜,其最终估值有望定在450亿美元左右。一旦本轮融资落地,这将是国家大基金首次公开注资本土大语言模型厂商。消息人士透露,参与此次融资谈判的其他潜在投资者中,还有中国科技巨头腾讯。另一位潜在人选是DeepSeek创始人梁文锋,知情人士称他也将在本轮中以个人名义出资一部分。不过,本轮融资的最终参投方阵容尚未尘埃落定。
5月7日消息,有消息称,国家集成电路产业投资基金(简称“国家大基金”)正在与DeepSeek洽谈主导其首轮融资事宜,其最终估值有望定在450亿美元左右。对此,消息人士称,“双方确实在进行洽谈。但是目前估值还未最终确认。”该消息人士同时透露,“同时进行融资谈判的潜在投资方还有很多,其中也包括几个互联网巨头和其他一些国资基金。”不过该人士也表示,现阶段参与本轮融资洽谈的各家投资机构均保持低调。这类头部明星企业的重大融资项目,各方态度普遍更为审慎,在相关事宜最终敲定前不会对外随意披露信息。目前,本轮融资的最终投资机构名单仍未确定。
4月26日消息,Create2025百度AI开发者大会日前在武汉举办,百度创始人李彦宏发表了题为《模型的世界 应用的天下》的演讲。谈到DeepSeek,李彦宏称,百度各个业务线第一时间接入了DeepSeek,但DeepSeek也不是万能的,它只能处理单一的文本,还不能理解声音、图片、视频等多媒体内容,同时幻觉率比较高,很多场合不能放心使用。“它最大的问题是慢和贵,中国市场上绝大多数大模型API的价格都更低,而且反应速度更快。”
2月22日消息,亚布力中国企业家论坛第25届年会于2025年2月21日-23日召开。新东方董事长俞敏洪出席开幕式并发表演讲。演讲中,俞敏洪提到DeepSeek称,“DeepSeek所做的事情有巨大的能力,不是模仿而是突破和超越,所以年轻人面向未来的创业,他们的能力的储备跟我们这些老年人是完全不一样的,这些是值得我们这些老年人学习的。”
2月20日消息,怡亚通物流数字货运平台·运多星正式接入DeepSeek,利用DeepSeek强大的AI技术赋能平台,打造更智能、更高效的物流服务体系。此次接入标志着怡亚通物流在数字化、智能化转型道路上迈出了重要一步,也为数字货运领域的发展注入了新的活力。