再见，Llama。

张开发

• 2026/4/11 0:15:38 • 15 分钟阅读

分享文章

✅OSC源创会 × FAIR plus 2026深圳会展中心福田9号馆4号会议室报名 oschina.net/event/8598188开源大模型之争谷歌向左Meta 向右。就在谷歌宣布 Gemma 4 全面拥抱开源之后的第 6 天Meta 在官网发出一则公告宣布新一代大模型 Muse Spark 正式上线。公告写道这是“Meta有史以来最强大的模型”将通过 meta.ai 和 Meta AI 应用向用户开放。公告里没有 GitHub 链接没有模型权重下载地址没有 HuggingFace 页面 —— 过去两年每一次 Llama 系列发布这三样东西都是标配。这一次什么都没有。开源人设的建立2023 年 2 月Meta 首次发布 LLaMA。那次的发布本来是“学术限定”即仅对研究机构开放附上申请表即可免费使用。但没过几天模型权重就被人贴在了 4chan 上随即在整个互联网扩散。泄露是意外但 Meta 做了一个主动选择没有追究也没有撤回而是顺势转向全面开放。从那之后开源成了扎克伯格的主动人设也成了他对外抢占舆论阵地的武器。彼时他在博客里写了一篇长文直接点名批评 OpenAI“封闭AI对社会不利开源才能建立真正的信任。”每次 Llama 新版发布他都会亲自上阵社交媒体宣传强调权重下载免费、商用不受限。这套逻辑被他讲了又讲开源不是慈善是让开发者绕开竞争对手、直接在 Meta 的生态里建东西。到 Llama 3 时这个人设已经完全立住了。Llama 系列累计下载量超过 12 亿次依托它建立技术栈的初创公司数以千计。AI 圈的一个段子是OpenAI 在挖护城河Meta 在填护城河。刷榜留下的裂痕2025 年 4 月Meta 发布 Llama 4宣称在多项基准测试中超越了 GPT-4.5 和 Claude Sonnet 3.7然而在发布会后不到 48 小时争议出现了。社区里有人注意到Meta 提交给 LM Arena 进行评测的 Maverick 版本和公开供下载的版本不是同一个东西。有匿名帖子自称来自 Meta 前工程师声称Llama 4 团队调整了训练后处理的数据集以获取更漂亮的基准分数。Meta 副总裁 Ahmad Al-Dahle 出面否认说公司没有在测试集上直接训练。但他没能提供验证这一说法所需的技术细节和原始数据回应略显苍白。更实际的问题随后出现了开发者拿到模型之后真实使用效果和发布会上的数字对不上。Llama 4 的下载量和开发者采纳率都远低于预期。与此同时中国的 Qwen 和 GLM 系列在海外下载量上开始反超。开源人设背后的支撑 —— 大模型性能优势开始松动。143 亿美元挖来的华裔天才2025 年 4 月扎克伯格主动联系 Alexandr Wang邀请对方喝咖啡。这位 1997 年出生的华裔天才是 Scale AI 的创始人他的父母是洛斯阿拉莫斯国家实验室的核物理学家他高中时参加全美数学竞赛以出色的成绩进了 MIT大一结束后辍学创业。Scale AI 做的事不算性感 —— 为 AI 公司做数据标注、模型评估 —— 但整个行业都离不开它。OpenAI、Google、Meta 都是它的客户。2021 年Wang 以 24 岁的年纪成为全球最年轻的“白手起家亿万富翁”。两人在塔霍湖和帕洛阿尔托见了几次面。两个月后协议落地Meta 以 143 亿美元收购 Scale AI 49% 的非投票股权Wang 以“Meta 首席 AI 官”身份加盟领导新成立的 Meta Superintelligence LabsMSL直接向扎克伯格汇报。协议里有一条“毒丸条款”若 Wang 离职其股权将按 1.5 倍稀释折算下来约有 50 亿美元的“违约金”。Meta 对外的说法是“重建整个 AI 技术栈”。内部知情者的说法更直白Llama 路线已经走到天花板要正面和 OpenAI、Gemini 打需要一支全新的队伍。Wang 接手后MSL 花了九个月时间做出了 Muse Spark。重返第一梯队Muse Spark 的内部代号是“Avocado”从架构上就不是 Llama 的延伸。它是原生多模态设计视觉和文本在底层融合不是事后拼接进去的。它有三种工作模式即时模式处理日常对话思考模式用于复杂推理“沉思模式”Contemplating Mode尚未全面上线 —— 它会协调多个子代理并行推理对标的是 GPT-5.4 和 Gemini 3.1 Pro 的顶级推理能力。Meta 重点介绍了一种叫“思维压缩”Thought Compression的训练技术声称以少 10 倍的算力消耗达到了与 Llama 4 Maverick 相当的推理能力。第三方评测机构 Artificial Analysis 给 Muse Spark 在 Intelligence Index 上打了 52 分全球第四排在 Gemini 3.1 Pro Preview57分、GPT-5.457分和 Claude Opus 4.653分之后。作为对照Llama 4 Maverick 在同一评测里仅得了 18 分。多模态推理CharXiv测试得分 86.4高于 GPT-5.4 的 82.8 和 Gemini 3.1 Pro 的 80.2医疗推理HealthBench Hard得分 42.8远高于 Claude 4.6 的 14.8。数字本身说明不了全部但结论是清晰的Muse Spark 在性能上确实进入了第一梯队。封闭的信号Muse Spark 目前只通过 meta.ai 和 Meta AI 应用提供没有下载渠道没有开放 API仅有少数所谓的“精选合作伙伴”获得了私有 API 预览权。Meta 发言人给出的说法是“当前的 Llama 模型将继续以开源形式提供。”Wang 在 X 上发帖承认转型“存在一些需要打磨的粗糙之处”并表示“计划在未来的版本开源”。这给开发者读到的信号是最好的模型不会再开源了。「当前的 Llama 模型」这个措辞被反复咀嚼。这不是“我们会继续开源”而是“我们已有的这些还开着”。“未来版本计划开源”也不是承诺是可以随时收回的意向。这对依赖 Llama 生态的团队来说是很现实的问题。初创公司的技术选型、研究机构的模型访问、个人开发者的工具链都建立在“Meta 会把最好的东西开放出来”这个假设上而这个假设在今天已经站不住脚了。开源倡导者的落幕Meta 的开源哲学从来不是纯粹的理想主义它是一种策略用开放的模型建立开发者生态用生态建立竞争壁垒用竞争壁垒绕开和 OpenAI 的正面交锋。这个策略在 Llama 3 时代运转得很好在 Llama 4 时代开始失灵。竞争格局变了。开源市场里Qwen 和 GLM 来势汹汹闭源市场里GPT-5 和 Gemini 3 在性能上甩开了距离。Meta 的处境是在开源端被追赶在闭源端没有入场券。Muse Spark 是 Meta 购买闭源赛场入场券下的一步棋。扎克伯格没有正式宣布放弃开源。他说的是“计划开源未来版本”。但对于已经把业务建在 Llama 上的开发者来说这句话的意思很清楚当 Meta 有更好的模型可以端上来卖钱的时候开源的那个将会是上一代。Meta 不是第一家走这条路的公司。两年前AI 圈里有一句被反复引用的扎克伯格金句“闭源 AI 对社会不利。”那句话今天读起来已经是另一番滋味。参考链接https://my.oschina.net/u/4487475/blog/19481944https://about.fb.com/news/2026/04/introducing-muse-spark-meta-superintelligence-labs/https://www.cnbc.com/2026/04/08/meta-debuts-first-major-ai-model-since-14-billion-deal-to-bring-in-alexandr-wang.htmlhttps://venturebeat.com/technology/goodbye-llama-meta-launches-new-proprietary-ai-model-muse-spark-first-sincehttps://www.wired.com/story/muse-spark-meta-open-source-closed-source/https://techstartups.com/2025/04/08/llama-4-scandal-metas-release-of-llama-4-overshadowed-by-cheating-allegations-on-ai-benchmark/https://apnews.com/article/meta-ai-superintelligence-agi-scale-alexandr-wang-4b55aabf7ea018e38ffdccb66e37cf26

更多文章

前端开发 2026/4/11 0:13:25

S2-Pro集成开发环境搭建：VSCode远程连接与调试指南

S2-Pro集成开发环境搭建：VSCode远程连接与调试指南 1. 为什么需要远程开发环境当你开始使用S2-Pro这类大模型时，本地电脑的性能往往难以满足需求。GPU服务器提供了强大的计算能力，但直接在服务器上开发又不够方便。这就是为什么我们需要搭…

响应式设计进阶技巧 1. 前言在当今多设备时代，响应式设计已成为前端开发的标准实践。本文将深入探讨响应式设计的高级技巧，帮助你创建更加灵活、高效的响应式网站。 2. 响应式设计基础 2.1 核心概念响应式设计的核心是根据设备屏幕尺寸和方向自动调整布…

张开发

前端开发 2026/4/10 23:38:45

在Windows11上通过QEMU构建ARM64开发测试环境

1. 为什么要在Windows11上搭建ARM64环境？ 最近几年ARM架构处理器越来越火，从手机芯片到苹果M系列处理器，再到各种物联网设备，ARM64已经成了不可忽视的技术生态。作为开发者，我们经常需要在本地测试ARM平台的软件兼容性…

张开发

再见，Llama。

最新文章

DAMOYOLO-S企业级应用：结合SpringBoot构建智能安防系统

一键部署DeepSeek-OCR：WEBUI镜像让复杂场景文字识别变得简单高效

Kandinsky-5.0-I2V-Lite-5s开发者指南：supervisor服务管理与日志排查技巧

Phi-3-Mini-128K实际案例：为芯片设计团队提供Verilog代码规范检查建议

VMware Workstation Pro 25H2u1 macOS Unlocker OEM BIOS 2.7 for Windows

STM32 Bootloader避坑指南：为什么你的F103C8T6程序升级后跑飞了？

推荐文章

锂电池保护板方案：中颖SH367309方案原理图和PCB源代码深度解析

CSS Clip-Path 动画：形状变换的视觉魔法

CSS Subgrid：网格布局的终极进化

大模型训练全流程:预训练，监督微调，RLHF

毕设日志26.4.4（1）:画原理图，画板

QEi编码器接口原理与工业级抗干扰实战指南

相关文章

别再让PDF图片丢失了！Dify二次开发实战：优化知识库的图文混合检索能力

热点 | Harness 架构深度解析：AI智能体编排框架的核心原理

【Python时序预测实战】融合LSTM与Transformer：从模型构建到单变量预测全流程解析

MySQL分区表实战：从原理到高效数据管理

CSRankings区域筛选功能深度解析：如何找到全球最佳CS研究机构

OpCore-Simplify：让开源系统硬件适配从8小时到30分钟的技术革命

分享文章

更多文章

S2-Pro集成开发环境搭建：VSCode远程连接与调试指南

告别重复登录！用Playwright连接你已登录的Chrome，5分钟搞定自动化数据采集

ERTEC 系列 PROFINET 芯片级硬件过滤器分析换

Git-RSCLIP优化技巧：英文标签这样写，遥感图像分类准确率更高

Nature | 单细胞空间组学揭示肿瘤血管生成与免疫微环境互作新机制

oh-my-codex 使用教程与最佳实践

[免费下载】复杂环境柑橘成熟度数据集

Hermes Agent 完整知识总结与使用教程

武昌区文化墙设计制作一体

EXCEL VLOOKUP函数实战：从基础查询到跨表数据对比

响应式设计进阶技巧

在Windows11上通过QEMU构建ARM64开发测试环境