再见,Llama。

张开发
2026/4/11 0:15:38 15 分钟阅读

分享文章

再见,Llama。
✅OSC源创会 × FAIR plus 2026深圳会展中心福田9号馆4号会议室报名 oschina.net/event/8598188开源大模型之争谷歌向左Meta 向右。就在 谷歌宣布 Gemma 4 全面拥抱开源之后的第 6 天Meta 在官网发出一则公告宣布新一代大模型 Muse Spark 正式上线。公告写道这是“Meta有史以来最强大的模型”将通过 meta.ai 和 Meta AI 应用向用户开放。公告里没有 GitHub 链接没有模型权重下载地址没有 HuggingFace 页面 —— 过去两年每一次 Llama 系列发布这三样东西都是标配。这一次什么都没有。开源人设的建立2023 年 2 月Meta 首次发布 LLaMA。那次的发布本来是“学术限定”即仅对研究机构开放附上申请表即可免费使用。但没过几天模型权重就被人贴在了 4chan 上随即在整个互联网扩散。泄露是意外但 Meta 做了一个主动选择没有追究也没有撤回而是顺势转向全面开放。从那之后开源成了扎克伯格的主动人设也成了他对外抢占舆论阵地的武器。彼时他在博客里写了一篇长文直接点名批评 OpenAI“封闭AI对社会不利开源才能建立真正的信任。”每次 Llama 新版发布他都会亲自上阵社交媒体宣传强调权重下载免费、商用不受限。这套逻辑被他讲了又讲开源不是慈善是让开发者绕开竞争对手、直接在 Meta 的生态里建东西。到 Llama 3 时这个人设已经完全立住了。Llama 系列累计下载量超过 12 亿次依托它建立技术栈的初创公司数以千计。AI 圈的一个段子是OpenAI 在挖护城河Meta 在填护城河。刷榜留下的裂痕2025 年 4 月Meta 发布 Llama 4宣称在多项基准测试中超越了 GPT-4.5 和 Claude Sonnet 3.7然而在发布会后不到 48 小时争议出现了。社区里有人注意到Meta 提交给 LM Arena 进行评测的 Maverick 版本和公开供下载的版本不是同一个东西。有匿名帖子自称来自 Meta 前工程师声称Llama 4 团队调整了训练后处理的数据集以获取更漂亮的基准分数。Meta 副总裁 Ahmad Al-Dahle 出面否认说公司没有在测试集上直接训练。但他没能提供验证这一说法所需的技术细节和原始数据回应略显苍白。更实际的问题随后出现了开发者拿到模型之后真实使用效果和发布会上的数字对不上。Llama 4 的下载量和开发者采纳率都远低于预期。与此同时中国的 Qwen 和 GLM 系列在海外下载量上开始反超。开源人设背后的支撑 —— 大模型性能优势开始松动。143 亿美元挖来的华裔天才2025 年 4 月扎克伯格主动联系 Alexandr Wang邀请对方喝咖啡。这位 1997 年出生的华裔天才是 Scale AI 的创始人他的父母是洛斯阿拉莫斯国家实验室的核物理学家他高中时参加全美数学竞赛以出色的成绩进了 MIT大一结束后辍学创业。Scale AI 做的事不算性感 —— 为 AI 公司做数据标注、模型评估 —— 但整个行业都离不开它。OpenAI、Google、Meta 都是它的客户。2021 年Wang 以 24 岁的年纪成为全球最年轻的“白手起家亿万富翁”。两人在塔霍湖和帕洛阿尔托见了几次面。两个月后协议落地Meta 以 143 亿美元收购 Scale AI 49% 的非投票股权Wang 以“Meta 首席 AI 官”身份加盟领导新成立的 Meta Superintelligence LabsMSL直接向扎克伯格汇报。协议里有一条“毒丸条款”若 Wang 离职其股权将按 1.5 倍稀释折算下来约有 50 亿美元的“违约金”。Meta 对外的说法是“重建整个 AI 技术栈”。内部知情者的说法更直白Llama 路线已经走到天花板要正面和 OpenAI、Gemini 打需要一支全新的队伍。Wang 接手后MSL 花了九个月时间做出了 Muse Spark。重返第一梯队Muse Spark 的内部代号是“Avocado”从架构上就不是 Llama 的延伸。它是原生多模态设计视觉和文本在底层融合不是事后拼接进去的。它有三种工作模式即时模式处理日常对话思考模式用于复杂推理“沉思模式”Contemplating Mode尚未全面上线 —— 它会协调多个子代理并行推理对标的是 GPT-5.4 和 Gemini 3.1 Pro 的顶级推理能力。Meta 重点介绍了一种叫“思维压缩”Thought Compression的训练技术声称以少 10 倍的算力消耗达到了与 Llama 4 Maverick 相当的推理能力。第三方评测机构 Artificial Analysis 给 Muse Spark 在 Intelligence Index 上打了 52 分全球第四排在 Gemini 3.1 Pro Preview57分、GPT-5.457分和 Claude Opus 4.653分之后。作为对照Llama 4 Maverick 在同一评测里仅得了 18 分。多模态推理CharXiv测试得分 86.4高于 GPT-5.4 的 82.8 和 Gemini 3.1 Pro 的 80.2医疗推理HealthBench Hard得分 42.8远高于 Claude 4.6 的 14.8。数字本身说明不了全部但结论是清晰的Muse Spark 在性能上确实进入了第一梯队。封闭的信号Muse Spark 目前只通过 meta.ai 和 Meta AI 应用提供没有下载渠道没有开放 API仅有少数所谓的“精选合作伙伴”获得了私有 API 预览权。Meta 发言人给出的说法是“当前的 Llama 模型将继续以开源形式提供。”Wang 在 X 上发帖承认转型“存在一些需要打磨的粗糙之处”并表示“计划在未来的版本开源”。这给开发者读到的信号是最好的模型不会再开源了。「当前的 Llama 模型」这个措辞被反复咀嚼。这不是“我们会继续开源”而是“我们已有的这些还开着”。“未来版本计划开源”也不是承诺是可以随时收回的意向。这对依赖 Llama 生态的团队来说是很现实的问题。初创公司的技术选型、研究机构的模型访问、个人开发者的工具链都建立在“Meta 会把最好的东西开放出来”这个假设上而这个假设在今天已经站不住脚了。开源倡导者的落幕Meta 的开源哲学从来不是纯粹的理想主义它是一种策略用开放的模型建立开发者生态用生态建立竞争壁垒用竞争壁垒绕开和 OpenAI 的正面交锋。这个策略在 Llama 3 时代运转得很好在 Llama 4 时代开始失灵。竞争格局变了。开源市场里Qwen 和 GLM 来势汹汹闭源市场里GPT-5 和 Gemini 3 在性能上甩开了距离。Meta 的处境是在开源端被追赶在闭源端没有入场券。Muse Spark 是 Meta 购买闭源赛场入场券下的一步棋。扎克伯格没有正式宣布放弃开源。他说的是“计划开源未来版本”。但对于已经把业务建在 Llama 上的开发者来说这句话的意思很清楚当 Meta 有更好的模型可以端上来卖钱的时候开源的那个将会是上一代。Meta 不是第一家走这条路的公司。两年前AI 圈里有一句被反复引用的扎克伯格金句“闭源 AI 对社会不利。”那句话今天读起来已经是另一番滋味。参考链接https://my.oschina.net/u/4487475/blog/19481944https://about.fb.com/news/2026/04/introducing-muse-spark-meta-superintelligence-labs/https://www.cnbc.com/2026/04/08/meta-debuts-first-major-ai-model-since-14-billion-deal-to-bring-in-alexandr-wang.htmlhttps://venturebeat.com/technology/goodbye-llama-meta-launches-new-proprietary-ai-model-muse-spark-first-sincehttps://www.wired.com/story/muse-spark-meta-open-source-closed-source/https://techstartups.com/2025/04/08/llama-4-scandal-metas-release-of-llama-4-overshadowed-by-cheating-allegations-on-ai-benchmark/https://apnews.com/article/meta-ai-superintelligence-agi-scale-alexandr-wang-4b55aabf7ea018e38ffdccb66e37cf26

更多文章