DeepSeek V4：这个中国 AI 模型，决定不带英伟达玩了

张开发

• 2026/6/1 20:36:54 • 15 分钟阅读

分享文章

文章目录前言一、从春节见到四月见一场漫长的等待二、不带英伟达玩一场釜底抽薪的豪赌三、万亿参数长期记忆V4 到底强在哪四、反内卷的团队为什么敢这么慢五、慢下来是为了跳得更远前言DeepSeek 把 V4 的发布推迟了几个月。不是为了憋大招而是为了干一件更硬的事让模型跑在国产芯片上。朋友们这事儿有多硬呢打个比方就像你本来开着保时捷在高速公路飙车突然决定要把发动机换成自主研发的而且还要保证速度不降甚至更快。这在 AI 圈简直是自杀式挑战。但梁文锋就这么干了。一、从春节见到四月见一场漫长的等待熟悉 DeepSeek 的朋友们都知道这家公司的发布节奏一向很卷。2025 年那会儿他们几乎是月更V3、R1、V3.2 一个接一个打得对手喘不过气。但自从 2025 年 12 月 V3.2 发布之后DeepSeek 突然断更了。按照外界的预期V4 应该在 2026 年春节前后亮相。毕竟那时候豆包、千问、元宝都在扎堆发新版生怕晚一步就被 V4 的光芒盖过。春节过了没动静2 月中旬继续等3 月初大家伸长脖子结果等来的却是服务器繁忙的宕机通知。3 月 29 日晚上DeepSeek 经历了一次长达 13 小时的大规模服务中断。网页端、App 全面卡顿服务器繁忙的提示刷屏相关话题瞬间冲上热搜前十。技术社区里有人猜测这哪是故障分明是 V4 在做隐身测试啊。你别说这种猜测还真有迹可循。早在 2 月 11 日DeepSeek 就悄悄把现有模型的上下文窗口从 128K 扩展到了 1M tokens知识截止也更新到了 2025 年 5 月。这种基础设施级别的升级怎么看都像是在给 V4 铺路。二、不带英伟达玩一场釜底抽薪的豪赌好了重点来了。为什么 V4 要推迟这么久 Reuters 的一则报道揭开了谜底DeepSeek 在即将进行重大模型更新之前未向英伟达展示其即将推出的旗舰模型这打破了行业标准做法。这意味着什么咱们都知道英伟达能撑起万亿市值靠的不仅仅是 GPU 硬件还有那打磨了十几年的 CUDA 软件生态。CUDA 就像是给全球 AI 开发者铺好的高速公路你沿着走总能大力出奇迹。但 DeepSeek 这次要做的是铺一条绕过 CUDA的国道而且要走通。据 icsmart 报道DeepSeek V4 已基于包括华为在内的最新国产 AI 芯片进行了深度优化。这里说的主要是华为昇腾 950PRAscend 950PR处理器这款芯片在 2026 年 3 月 21 日的华为中国合作伙伴大会上正式发布。咱们来看看这块芯片的硬实力算力达到 1PFLOPSFP8/ 2PFLOPSFP4HBM 容量 128GB互联带宽 2TB/s。与英伟达 H20 相比昇腾 950PR 的 HBM 容量是 H20 的 1.16 倍多模态生成速度可以提升 60%。更夸张的是阿里巴巴、字节跳动与腾讯等中国科技巨头已经提前下单了数十万颗华为新一代 AI 芯片就是为了应对基于 V4 的云服务上线需求。这就好比一场游戏英伟达本来是唯一的显卡供应商所有玩家都得找他买装备。现在 DeepSeek 说我要自己造一套装备而且还要带上一帮兄弟一起用。这已经不是技术问题这是生态战争。三、万亿参数长期记忆V4 到底强在哪当然光是换芯片还不够V4 本身的技术升级同样吓人。据外媒报道V4 可能采用万亿参数的 MoE混合专家架构但每次推理只激活 320 亿参数。这是什么概念你能用到万亿参数的能力只需要付 320 亿参数的钱。这就像是花经济舱的钱享受头等舱的服务典型的 DeepSeek 式暴力美学。但最让我兴奋的是一个叫 LTMLong-Term Memory长期记忆的技术。现在的 AI说白了就是金鱼脑子聊完就忘。虽然 OpenClaw 这类产品可以通过往本地文件里写笔记来假装记得但本质上还是把历史记录塞进上下文用久了 token 消耗爆炸成本感人。而 LTM 要做的是把记忆能力直接嵌入模型架构本身。根据梁文锋 2026 年 1 月署名发表的论文《Conditional Memory via Scalable Lookup》DeepSeek 提出了一种条件记忆机制能让 AI 跨对话、跨任务地记住用户是谁、聊过什么、偏好什么。打个比方现在的 AI 每次对话都像刚认识你的陌生人而有了 LTMAI 就像你的老朋友知道你爱吃辣、知道你最近在忙项目、知道你之前讨论过的问题卡在哪。这种人情味才是 AI 真正走向实用的关键。此外V4 还可能是原生多模态从架构层面就支持图片、视频、文本的理解和生成而不是像现在这样后期拼接。知识截止也可能更新到 2026 年 1 月基本追平当前时间线。四、反内卷的团队为什么敢这么慢说到这你可能会问DeepSeek 凭什么敢这么慢换成别的公司面对全行业翘首以盼的局面早就把半成品推出去了。先占声量再慢慢迭代这是互联网行业的基本操作。但梁文锋偏不。据 i黑马报道DeepSeek 的工作节奏在全球 AI 实验室中独树一帜。多数员工下午 6 到 7 点下班早上不打卡没有明确绩效考核。梁文锋认为一个人每天能高质量工作的时间很难超过 6 到 8 小时加班疲劳下的昏庸判断反而会浪费算力得不偿失。这种反内卷文化让 DeepSeek 更像一个研究实验室而不是传统意义上的营利性企业。虽然近期有核心成员被腾讯等巨头以 2-3 倍薪酬挖走但更多人选择了留下。对梁文锋来说不发永远比发错重要。R1 之所以能一炮封神靠的不是抢跑而是一出手就让对手无话可说。他显然打算用同样的方式对待 V4——要么不发要发就是王炸。五、慢下来是为了跳得更远2025 年DeepSeek 用 V3 和 R1 证明了中国模型可以硬刚 OpenAI。2026 年当 OpenAI 和 Anthropic 进入月更模式疯狂刷存在感时DeepSeek 却选择了慢下来。这种慢不是掉队而是蓄力。从单纯刷榜转向构建 Agent 系统工程从依赖英伟达转向适配国产芯片从更聪明的模型转向真正可执行的系统。这些转变每一项都是架构级的重构都不是小修小补能解决的。正如林俊旸所说AI 时代正从推理式思维转向智能体思维。未来的主流不再是想更久而是为了行动而想。DeepSeek V4 的推迟恰恰是在为这个时代做准备。所以当 V4 真正发布的那一天我们看到的不会只是一个更强的模型而是一个国产大模型国产芯片的完整闭环是一个能记住你、理解你、帮你在真实环境里干活的智能体。这场等待值得。朋友们如果你也对 AI 感兴趣想了解 DeepSeek V4 的最新进展记得关注我。咱们下篇文章见目前国内还是很缺AI人才的希望更多人能真正加入到AI行业共同促进行业进步增强我国的AI竞争力。想要系统学习AI知识的朋友可以看看我精心打磨的教程 http://blog.csdn.net/jiangjunshow教程通俗易懂高中生都能看懂还有各种段子风趣幽默从深度学习基础原理到各领域实战应用都有讲解我22年的AI积累全在里面了。注意教程仅限真正想入门AI的朋友否则看看零散的博文就够了。

DeepSeek V4：这个中国 AI 模型，决定不带英伟达玩了

最新文章

从芯片制造到电路设计：为什么CMOS工艺偏爱P型衬底？聊聊背后的历史与技术选择

【GraalVM静态镜像内存优化终极指南】：20年JVM专家亲授，从启动内存暴增300%到稳定＜25MB的7大实战压测技巧

TVA技术在洗煤车间检测中的场景适配与工艺优化

别只当数据搬运工了！深入STM32H7的DMA FIFO与突发传输，提升你的系统带宽（内存位宽不匹配怎么办）

大数据应用开发赛项备赛指南：从零开始掌握电商与工业互联网数据集处理

别再全局改MyBatis-Plus的maxLimit了！3.4版本后这样按需突破分页限制更安全

推荐文章

相关文章

分享文章

更多文章

2025校招面试潜规则：面试官不说，但决定你生死的硬核真相

Wilson Connectivity与Autonomous Systems推出无线网络自动化

计算机毕业设计：Python汽车数据分析与智能推荐系统 Django框架 snowNLP 协同过滤推荐算法 requests爬虫可视化（建议收藏）✅

3D Slicer实战：如何用窗宽窗位技术优化CT图像诊断（附VTK代码片段）

Qwen3-ASR案例展示：会议记录、视频字幕、实时转写全搞定

OpenClaw对接微信/飞书：工作指令实时触发，结果同步推送

定时广播软件，精准到秒定时，多模式多周期播放，任务智能管理，一站式解决校园打铃、广播通知痛点

Codesys V3.5 SP18 实战：用G代码驱动Delta机械手，从CNC到机器人控制的平滑迁移

探秘书匠策AI：解锁期刊论文写作的“智慧密钥”

手把手教你理解PLL锁相环中的VCO工作原理（附电路图解析）

Hyperf方案 Apollo配置中心

Canape实战指南：XCP工程配置与调试（一）