中国AI 大厂,被Deepseek 掀了牌桌之后

【来源:虎嗅网】

本文来自微信公众号:极客公园 (ID:geekpark),作者:连冉,原文标题:《中国 AI 大厂,被 Deepseek 掀了牌桌之后》

过去几个月,尤其是2025年一季度,国内大厂在AI大模型领域的声量明显低调了不少。最直观的感受就是,发布会明显少了许多。对比去年同期,大厂几乎是轮番上阵、接连发布新成果,而今年则低调了不少,声音变得谨慎,动作也更克制。

这种转变,多少跟DeepSeek-R1在春节期间的发布有关,这个模型以开源、低价、高性能的组合,打破了「大模型=高投入、高门槛」的行业共识,也撬动了模型产业的权力结构。

它不仅刷新了开发者对开源模型的认知,也动摇了此前被大厂视为护城河的「重资产」范式。一时间,硅谷科技股应声回调,千亿美元研发投入的必要性也被重新审视。

而在国内,这场「技术地震」最先震动的,其实正是那些原本被认为应该在AI战役中冲在最前的大厂们。一边是像DeepSeek、Manus这样的新玩家用「小而强」「快而灵」的策略不断迭代突破,另一边却是大厂在产品落地、组织架构、技术方向上的多次调整与迟疑。

新玩家冲击的,不只是模型性能或训练成本,更是许多建立在历史经验基础上的路径依赖——比如「只有闭环才有护城河」「只有高预算才能出好模型」「只有通用大一统才是正确方向」。

越来越多的事实正在指向同一个结论:在AI快速演进的浪潮中,任何僵化的范式认知,都可能成为创新的绊脚石。

今天的大厂,正在面临一次理念上的转向:不再追求「我的模型服务我的应用」的闭环逻辑,而是回到「用最合适的模型,构建最好的产品」这一产品主义原点。

一系列深层次的战略重构,正在中国互联网大厂里悄然发生。

01

回头看2023年,国产大模型赛道迅速升温,几乎所有有技术储备或生态优势的公司都在投入资源,试图在百模大战中找到自己的突破口。

彼时,百度、字节、腾讯等大厂纷纷亮出自研模型,「自研闭环」几乎成为主流打法(阿里则探索开源较早),强调的是「模型要自主可控,生态要自给自足」,从底层模型到应用产品都要打通。

在这样的背景下,百度主打「模型+搜索」路径,字节力推豆包,阿里对通义千问团队进行拆分以优化资源配置,腾讯则相对谨慎地投入「混元」大模型,整体更强调「应用场景驱动」,小厂中也出现了面壁、智谱、百川、月之暗面等一批专注通用大模型训练的「AI六小龙」,试图在技术路线或创新方向上突围。

彼时大家的竞争逻辑还建立在几个假设之上:1)自研能力越强越有护城河;2)参数量和能力相关,性能靠堆大模型赢;3)需要构建一个「自我可控」的模型+应用闭环。

但这些共识在DeepSeek-R1发布之后被彻底打破。2025年1月DeepSeek-R1的亮相,被行业视为一个「临界点」事件——一方面,它以极低的成本训练出了对标GPT-4的能力,公开技术细节并放出权重;另一方面,它代表着一种更彻底的「开源范式」:不是简单开放一个模型,而是直接让下游开发者「拿来即用」,训练思路、数据比例、推理效率都一目了然。

这直接打在了原来那种「闭环型自研」的路线要害上。很多大厂花大钱训练的模型,在DeepSeek-R1面前变得毫无优势——不是能力不行,而是「性价比不行」:你没法再说「自研比别人更强」,因为别人把过程全开了,而且你追上也要几个月;你也没法说「闭环护城河更高」,因为别人三两天就能基于DeepSeek-R1搭个demo,甚至用它打磨出产品。

这种「开源即能力平权」的冲击,不只打到了大厂,也打乱了AI小龙们的节奏。以面壁、百川为代表的「小模型派」,原本还希望在训练效率和推理速度上做文章,现在发现DeepSeek直接掀了桌子,把效率和能力统统平衡好了,而且是白送的——这让「闭源商业化」变得更加困难。

行业由此进入了一段显著的「战略迷茫期」:

大厂开始重新评估自研的价值:是否还值得烧钱去追一个很可能被开源赶超的模型?是否应该把精力转向「拼装模型能力+打造AI原生应用」的组合打法?

AI小龙们则面临最直接的生存压力:原来讲闭源、讲技术栈的优势正在消失;大厂又开始加速从开源模型中「拿货」,对它们的合作需求也在下滑;只能重新找定位,要么抱团,要么找「差异化垂直场景」。

投资人也在重新审视项目价值:一个大模型初创公司如果没有特别的创新机制或生态合作资源,其估值逻辑就会受到挑战。

总之,DeepSeek不是推出了一个强模型这么简单,它更像是一次「范式洗牌」:用极致透明和开源方式打破旧有路径依赖,把「自研大模型闭环」从主流选项变成了一个「代价极高」的冒险。这个时刻之后,谁能快速认清现实,找到新生态位,谁才有可能留在下一轮的牌桌上。

02

DeepSeek带来的冲击在持续发酵时,整个行业一开始是懵的,迷茫、不确定、不知所措。大家都知道这是一次系统性冲击,但具体要怎么应对、往哪儿走,其实那时候没有明确答案。

但从2月下旬开始,情况慢慢变了。大厂开始陆续有所动作,新的叙事也浮出水面。一句话总结就是:战略重心从去年强调「应用先行」「超级App」的落地路线,重新回到了「AGI优先」的轨道上。

这轮转向有几个关键的变化。

第一个变化是目标清晰了。过去讲AI应用的时候,很多公司都停留在「做一个超级App」的层面,比如搞一个AI助手、一个AI搜索或者AI办公工具。

但现在,在字节与阿里最新的对外表达中,都明确把「冲刺AGI」作为最核心的目标。

在2月的全员会上,字节CEO梁汝波曾表示:「智能水平是最重要的,要把提高智能本身当成最重要的目标,而不是某个产品的DAU。」

3月,豆包大模型部门召开全员会,明确部门的最重要目标是探索智能上限;同时强调进一步加强组织文化,提高技术开放程度,并考虑推进开源。

「Seed Edge」是字节豆包大模型团队在年初组建的AGI长期研究团队,鼓励探索更长周期的AGI研究课题,如推理能力、感知能力、软硬一体化等。

这个项目强调「宽松的研究环境」和「长周期考核」,为入选课题提供独立算力支持,体现了字节对AGI的长期布局。

Seed Edge的目标是探索AGI的新方法,鼓励跨模态、跨团队合作,目前初步确定了五大研究方向,包括探索推理能力的边界、探索感知能力的边界、探索软硬一体的下一代模型设计、探索下一代AI学习范式、探索下一个scaling方向。

可以看出,字节正在为通向AGI的下一阶段做技术储备。

2025财年财报后的电话会上,阿里CEO吴泳铭首次明确提出AGI是阿里AI战略的核心目标,甚至用了「AI将影响全球50%GDP结构」这样激进的表述。

这也意味着,阿里正在从强调「云+模型」服务能力,逐步走向更高层次的通用智能探索。

第二个变化,是对「开源」和「模型选择」的态度发生了实质变化。过去讲模型、做应用时,往往强调「全链路自主可控」,什么都要自己来。但现在,尤其是腾讯和百度,看起来越来越强调实用主义导向:谁的模型能力强就接谁的模型,应用产品的目标是用户满意、场景落地,而不是一定要套用自家大模型。

这背后,其实是每家公司在重新厘清自己的生态位——它在AI时代扮演什么角色,它的核心竞争力到底在哪里。

阿里的反应看起来「稳」一些,或者可以说是延续之前的节奏。

因为阿里在大模型上的投入本身就走在了开源路线的前列。通义千问(Qwen)系列在海外和开源社区持续表现强劲,Qwen2.5-Max一度号称性能超越DeepSeek-V3,而4月底刚开源的Qwen3,不仅成本显著降低,性能更是反超DeepSeek-R1和OpenAI-o1,登上开源模型榜首。阿里的打法很明确:先用模型性能证明自己,再用开源吸引全球开发者,把生态「引进来」。

不过,阿里的路径也并非一帆风顺。过去一段时间,由于组织架构频繁调整,大模型和AI业务一度陷入「各自为战」的割裂状态。但随着2024年阿里云重新整合、AI团队在马云回归后重新聚拢,阿里开始回到「集中力量办大事」的主模式。阿里云的回暖也证明了整合效果:在最新一个季度重新恢复双位数增长,再次稳坐国内市场头把交椅。

可以说,相比强调C端产品或Agent体验的打法,阿里正在重新确认自己在AI时代的角色——不是冲在最前的应用先锋,而是一个全球级的模型平台和技术基础设施提供者。

百度的选择,是比较务实的。一方面它有自己的文心模型体系,但另一方面它也明白,真正能打动用户的,是像百度文库、百度网盘这样的具体应用能不能变得更智能。所以在实际落地中,百度强调「谁好用就用谁」,哪怕不是自家的模型也没关系,只要能让文库变得更好用,就可以接入。

这种态度其实是经历过一次反思的。之前极客公园就曾经了解到,2024年百度内部其实是为了推动模型在各应用场景落地,分散了大量精力,导致文心团队反而没能集中精力把模型本身推上一个更高的台阶。新的调整,就是不再强求「模型服务所有应用」,而是让每个业务线根据场景灵活选择,把用户体验拉起来才是第一位。

而关于开源闭源之争,此前作为大模型闭源路线的坚定支持者,李彦宏此前曾多次公开表示,"闭源才能保证技术可控性、才有商业模式,开源其实是一种智商税"。

直到今年2月,百度选择了顺应开源的大趋势,宣布将在未来几个月中陆续推出文心大模型4.5系列,并于6月30日起正式开源。

腾讯的路径更清晰,也更符合它一贯的产品哲学。无论是微信、QQ还是游戏体系,腾讯最核心的资源就是这些连接用户的高频产品。对它来说,自研大模型不是必须的,关键是能不能把AI能力快速嵌入到这些产品里,提升效率和体验。

所以,当DeepSeek-R1新模型出现之后,腾讯是第一时间接入的公司之一,没有太多顾虑。毕竟据晚点报道,腾讯董事局主席兼CEO马化腾跟一些AI团队说过,「要好好与外部合作,不要想着什么都自己做」,以及「要清醒地认识到实际情况,不要过高估计自己的能力。」

2月13日,腾讯率先官宣接入「满血版」DeepSeek-R1,并迅速在全平台展开推广攻势。从微信、小红书到B站、知乎,元宝产品的广告铺天盖地,引发了用户对腾讯AI助手的集中关注。与此同时,腾讯内部也紧急协调,加速推动微信与DeepSeek的融合。

「元宝」入驻微信|图片来源:极客公园

相应地,腾讯也在组织架构上进行了一系列调整。继腾讯元宝从TEG(技术工程事业群)并入CSIG(腾讯云与产业事业群)之后,QQ浏览器、搜狗输入法、ima等更多产品也陆续划归CSIG,组成腾讯在大模型时代面向C端的新产品阵列。同时,这些产品原本隶属的团队和组织也将从PCG(平台与内容事业群)整体调整至CSIG,以更集中地推进AI战略下的产品布局与升级。

这一系列快速动作,其实体现了腾讯对「AI是能力,不是目的」的判断。更强的模型、更开放的生态,只要能赋能微信和游戏,那就应该立刻用起来。这一波,它反而成了最快适应变局的一家公司——甚至可以说,这次AI开放生态的发展节奏,刚好踩中了腾讯最擅长的能力嵌套逻辑。

字节跳动则是四家里最复杂、或许也可以说是最纠结的那个。它一方面拥有豆包大模型体系,另一方面又掌握了抖音、今日头条、番茄小说等超大规模应用场景。既想做AGI技术的引领者,又不愿放弃在应用层面的优势闭环。

但这就带来了两头要抓的压力——模型要领先,产品也要突出,生态既要自洽又要开放。在DeepSeek-R1爆火之后,字节一方面开始重申「AGI是核心目标」,加强对豆包的投入,也在开源方面更多动作;另一方面在应用层也出现了新的挑战:到底是坚持「豆包+字节应用」的闭环路线,还是打破内外壁垒,接入更强的外部模型去赛马?

据晚点报道,字节跳动最初对是否将DeepSeek接入旗下产品持观望态度,内部普遍认为「随时可以接入,不急」。然而,时机稍纵即逝,春节过后,字节开始紧急调动团队加班开发,加速整合DeepSeek。

目前看,字节的策略还在过渡期。一方面,它在对外表达中强调开源、强调开放生态价值;另一方面,在内部系统上,豆包仍然是很多应用场景的默认选择,只在少许应用上开放对DeepSeek模型的接入。但未来会不会像腾讯一样,开始在更广泛的层面接入第三方模型,或者在某些应用上放开「自家模型优先」的原则,现在还没有完全看清楚。

过去几个月是AI大厂们重新定位自己的生态角色、重新判断技术路径的关键窗口期。经历了DeepSeek-R1带来的「能力维度重构」之后,各家公司几乎都开始重新聚焦AGI这个长期目标,同时也在技术和生态层面更加现实与开放。

不过,即便目标一致,路径选择依然千差万别。这背后,是每家公司对自身优势的认知差异,也是它们对「AI时代应该怎么跑」的不同下注。

03

AI行业不会因为某一个产品突然「杀出重围」而终结对抗,它注定是一场持续上演的生态重构游戏——生态位置、能力分工将反复洗牌,而每一次冲击,都会逼迫玩家重新思考「我是谁、我该怎么做」。

在DeepSeek-R1的冲击下,大厂开始重新审视自己与AI的关系。这场变化不会停止:在AI这个快速演进的技术浪潮中,任何人其实都没有资格背负历史包袱。

历史包袱,不只是落后的产线、繁重的组织、冗余的团队,更是一种路径依赖式的认知惯性。

过去几年,整个AI行业积累了太多「默认共识」:比如做大模型一定要砸上亿美金、做AI应用一定要追求闭环、只有To B业务才能形成收入闭环、AI不是消费品只能是工具型软件……这些「理性判断」在过去的技术范式下看似正确,但在新路径被打通之后,很多「理性」就变成了限制想象力的牢笼。

技术革命的残酷性就在于,它并不会给巨头太多「吃老本」的机会。AI的快速迭代,正不断吞噬那些依赖过往成功经验的惯性组织。于是我们看到:百度转向开源,腾讯放下身段借势引流,字节加速重构算力体系……这些动作背后,藏着大厂对现实的一种「觉醒」:在AI的无限游戏中,唯一的生存法则,是保持战略弹性——既要摒弃对历史经验的盲目依赖,也要以开放姿态,拥抱技术普惠的新趋势。

旧范式困住了谁?

回顾国内过去两三年内大厂与头部创业公司的发展路径,几乎都踩在一套「经典剧本」上:

先围绕一个目标设定OKR;

再从模型能力、数据体系、应用矩阵做完整闭环;

最终希望通过模型降本、产品增长、生态协同走通商业路径。

这个逻辑没错,但问题是它太像过去互联网时代的打法了——它默认「资源越多,路径越清晰」;但AI的突变恰恰是在路径模糊中爆发的。

比如,之前很多团队一边追求「闭环场景」,一边困于「能力不足」;一边想讲「自主模型」的故事,一边又拿不到基础设施层的调优能力。很多战略决策是「既定假设+组织惯性」的结果——看起来合理,但没人停下来问:如果这些假设本身就错了呢?

反观这轮跑出来的新玩家,无论是DeepSeek、Manus,他们有个共同点:思维轻盈,没有历史负担,也没有路线执念,这反而让他们成了这轮范式跃迁的开拓者。

如果回过头去看,DeepSeek和Manus做的那些事,其实都没有多么玄学,甚至可以说都站得住工程逻辑。但为什么几乎没有大厂走这条路?因为它们过于理性、过于系统化,也就过于保守。

比如大厂可能会问:做MoE到底能不能规模化?极限调优是不是浪费时间?——这些问题本身没错,但当还没验证过路径,就先否定它,那可能永远不会发现新大陆。

这也是为什么,越来越多投资人、开发者、行业观察者开始重新审视AI创业的价值判断:不是谁能讲出最全的闭环,不是谁能招来最多的模型科学家,而是——谁能打破「历史正确性」,走出一条技术与产品都能快速验证的新路线。

在AI这条超高速前进的技术公路上,最危险的不是落后一步,而是还相信旧的红绿灯规则。真正的变化总是发生在「不合理」与「不被看好」之间。

本站部分内容来源于网络,如果你是该内容的作者,并且不希望本站发布你的内容,请与我们联系,我们将尽快处理!

黄龙溪谷塔希提售楼处电话-价格详情-实时更新-成都黄龙溪谷塔希提售楼处地址-在售户型