发布日期:2026-02-13 11:48 点击次数:54


2026 年的马年春节,AI 的炸药味以至盖过了红包味。
字节、、腾讯简直同期把 AI 大鸿沟推向台前:红包、免单、春晚互动、土产货糊口接入……王人在争进口。与此同期,BAT 三家也在基础模子上研究出牌,视频生成(Seedance 2.0)、图像(Qwen-IMAGE-2.0)、、语音模子密集更新,简直莫得空档。
不外,基础模子的抗争也从字节、阿里、等巨头马上推广到了 DeepSeek 和「AI 小龙」们。
2 月 11 日晚,DeepSeek 新模子版块全面上线,不息把长高下文与复杂任务智商往前推;简直团结时刻,智谱推出新一代旗舰 GLM-5,强调 Agent 与编程智商;MiniMax 也带来了 MiniMax M2.5,延续多模态与愚弄导向阶梯。
三家简直在团结时刻点动手,让这场春节 AI 大战的「模子交锋」又升级了一个档位。
巨头双线鼓励,既抢进口也抢模子;创业公司聚焦底层智商,把筹码压在基础模子上。简直决定 2026 年以至改日几年的竞争,正在这里伸开。
春节 AI 大战:前列发红包,后端拼模子
2 月 12 日,阿里千问晓示「春节 30 亿大免单」上线 6 天完成 1.2 亿笔 AI 下单,用户说了 41 亿次。稍早前,腾讯元宝则晓示春节行为启动 5 天,元宝 AI 生图功能日均调用增长 30 倍,时长增长超 80%。

如若说本年春节 AI 大战前半段是隧说念的进口之争,后半段则是更为复杂,从巨头到初创大模子公司,王人在荟萃发力基础模子的迭代。
这一丝其实雷科技在之前的报说念《一切为了Agent:千问、阶跃、Gemini打响「3.5模子大战」,春节将成枢纽节点?》就有提到,包括:
- 国外的 GPT-5.3-Codex 和 Claude Opus 4.6;- 国内依然发布的 Kimi 2.5、Step 3.5 Flash、SeedDance 2.0、Seedream 5.0;- 刚刚发布的 GLM-5、MiniMax M2.5、DeepSeek V3 系列更新;- 还有不得不发的 Doubao 2.0、Qwen 3.5、Gemin 3.5。DeepSeek V4大招还没发,把「长高下文」作念深是亮点
议论到 DeepSeek 并莫得发布官方博文,这一次更新的 DeepSeek 新模子约略率不是 V4,而是 V3.2 系列的更新(或为 V3.5)。
不外这也不错看作 V4 发布前的「灰度版」,因为按照 The Information 的最新爆料,DeepSeek V4 里面初步测试显现,其在模子的编程智商了依然衰败了 Claude(莫得指出具体模子)。
而从网友们息争收到的 DeepSeek 回应来看,DeepSeek 新模子的变化荟萃在两点:百万级长高下文和学问库更新。

率先是高下文窗口从之前的 128K 径直拉升到了 1M(100 万 Token),你不错一次性把《三体》全集或者一统共技俩的代码仓库塞给它。测试显现,它处理这类长文档的反应速率十分快,不再需要手动拆分文献。
另外,DeepSeek 新模子的学问库也更新到了 2025 年 5 月,但依然不维持多模态——无法相识图片(翰墨执行以外)和视频,也合乎 DeepSeek 一直坚握的「言语模子」阶梯:
不追求炫目的多模态,而是把文本推理、工程任务这些高频刚需作念到极致。
而高下文长度的大幅普及,不仅长文档处理与多轮推明智商更富厚,表面上也会改善长代码相识、多治安分析等复杂场景践诺发扬。
时隔 1 个多月迭代,智谱 GLM-5 把 Agent 推到台前

比拟之下,GLM-5 看成原生 Agent 基座模子的升级更具「代际感」。天然距离客岁底发布 GLM-4.7 只是往时 1 个多月,但智谱岁首上市时候预报的新一代模子,照实升级不小。
这一代模子的中枢枢纽词不再是对话,而是 Agent 与编程智商,也规格依然较着向「Agent 基础模子」靠近:高下文达到 200K 级别,最大输出可达 128K,模子鸿沟进一步扩大,考验体系也作念了重构。
但简直的变化照旧发生在智商结构上。
GLM-5.0 被径直经营为可践诺任务的 Agent 模子,强调编程智商、器用调用与长经过践诺。在编程测试中,它依然能处理技俩级代码与调试问题,模子不错拆解需求、调用接口、握续践诺任务,并在多阶段过程中保握目的一致。
不息押注多模态,MiniMax M2.5依然坚握坐褥至上

MiniMax 从模子到愚弄的垂直阶梯,依旧与前两者拉开距离。
MiniMax M2.5 的升级重心仍然放在多模态与执行生成智商,但强调的一整套多模态智商的鼓励,包括语音生成、音乐生成与文本智商同步普及,强调可径直进入创作与产物经过。
模子不息吸收 MoE 架构,开云app官方最新下载在保握鸿沟的同期收敛推理资本,更适应部署在愚弄侧。语音克隆、神志抒发、音乐生成质地的普及,使它更接近「坐褥器用」,而不是推理模子。
MiniMax 的定位因此也很了了——不是去比谁最贤人,而是更偏向让模子在执行坐褥要道简直可用,生成执行、参与创作、进入产物经过。
这条旅途也决定了 MiniMax 的目的不是 benchmark,而是可落地的坐褥智商。
三家模子的旅途相反由此变得十分具体:DeepSeek 把长推明智商作念到极致,智谱把模子推向 Agent 工程花样,MiniMax 则把多模态坐褥智商作念成基础设施。它们不再围绕团结套目的竞争,而是在不同智商方朝上构建各自的模子花样。
但共性一样较着。参数鸿沟不再是中枢卖点,聊天体验也不再是主要目的,扫数升级王人在指向一件事——模子要能参与确凿任务,而不仅是给出谜底。
DeepSeek 炸场一年后,「AI 小龙」位次已巨变
把时刻拨回到客岁春节,DeepSeek-V3 和 R1 的开源发布,冲击了全球 AI 样式,也成为「AI 小龙」阵营的分水岭。
枢纽不单是「模子很强」,更在于资本被再行界说。低资本、高性能的推理模子运行出现后,行业对基础模子的预期斯须变了——不单是条目严格考验出一个模子,而是条目更低资本的更强模子。

剧烈的模子竞争加快,再加之考验算力的匮乏,径直激励了「AI 小龙」阵营的较着分化。百川和零一简直依然退出「前沿基础模子」的主战场:前者转向医疗等垂直目的,后者更多走企业与行业场景阶梯,更新节律较着放缓。
当基础模子进入高插足、高密度迭代阶段,唯有一丝数团队还能长久承受算力与研发压力。
不外本年的情况又有些不一样,最径直的一丝等于 DeepSeek V4 于今莫得发布。从外部看,可能有两种解释。
一种是时候层面的现实:推明智商、长高下文、工程富厚性这些目的自己难度更高,模子要跨出一整代的差距,需要更长周期,况兼之前也传出过 DeepSeek 在考验过程遭受勤劳。另一种则是更偏计谋性,不单是随着友商统共发布,而是看成压轴登场,酿成宣发上的上风。
还有一个更容易被忽略的变化是:本年春节,DeepSeek 要靠近字节、阿里、腾讯在模子上的高强度插足,以及全球模子的快速迭代,最直不雅的例子等于最近引爆全球的字节 Seedance 5.0 视频模子。

天然,还在活跃的「AI 小龙」也在第一线握续鼓励基础模子的迭代,智谱 GLM 和阶跃星辰 Step 更多照旧荟萃在模子,面向行业提供更翻新、更实用的基础模子。
MiniMax 和月之暗面 Kimi 则更多主打「模子即愚弄」,不单打造模子,也在发力我方的原生 AI 愚弄,MiniMax 更是酿成了一定的产物矩阵,但二者王人在从基础模子到愚弄进行垂直整合。
这不是粗浅的「谁强谁弱」,而是一种更现实的分化。
写在临了
2026 年的春节还没慎重运行,但大模子下半场的发令枪依然响得震耳欲聋。
从巨头们的「撒币」进口战,到 DeepSeek、智谱、MiniMax 在初四晚上的模子突袭,这场仗的吩咐变了。民众不再执着于在 Benchmark 上刷分,而是运行比谁能更深地镶嵌确凿坐褥力:是吞下百万行代码的胃口,是自主跑通工程的双手,照旧相识东说念主类神志的耳朵。
DeepSeek 此次天然没祭出外传中的 V4,但这记「1M 高下文」的长拳,依然也让不少泛论 Agent 却处理不了长程顾虑的敌手感到脊背发凉。而智谱和 MiniMax 的定期对垒,则评释注解了「AI 小龙」们依然从客岁的防护反击,转向了更有底气的相反化蹙迫。
悬念依然存在。DeepSeek 憋了许久的 V4 究竟是在等一个「一力降十会」的压轴时刻,照旧在攻克某种未知的时候天花板?在大厂与小龙的混战中,谁能率先把「模子智商」简直盘曲为「生意护城河」?
但有一丝是细目的:2026 年,单纯靠「会聊天」依然拿不到门票了。烟花散去,留在牌桌上的,只然而那些能简直卷入职责流的狠扮装。