Gemma 4 谷歌开源的字节效率之王，全面支持文本、图像、视频和音频

张开发

• 2026/5/31 21:35:47 • 15 分钟阅读

分享文章

Google DeepMind 正式发布 Gemma 4 系列开放权重模型——首次全面支持文本、图像、视频和音频四种尺寸从手机芯片到工作站 GPU 全覆盖并以 Apache 2.0 彻底开放商用。开源社区下载量超 4 亿次衍生变体超过 10 万个——Gemma 的崛起已然是大语言模型开放生态的一个缩影。而这一次Gemma 4 带着突破性的多模态能力和极致的参数效率向着所有「闭源旗舰」发起了正面挑战。四款新模型覆盖全硬件场景Gemma 4 本次共推出四个尺寸版本针对不同计算环境精心设计其中「E」代表 Effective有效参数——E2B 和 E4B 通过Per-Layer Embeddings技术让嵌入层的巨量参数只做快速查表而非参与每次前向计算从而大幅压缩实际推理成本。26B 则采用混合专家MoE架构推理时仅激活其中 38 亿参数速度接近一个纯 4B 模型。基准测试以小博大的实力以下是几项关键基准测试结果指令微调版本对比 Gemma 3 27B在竞技场排行榜Arena AI上31B 版本位列开源模型全球第 326B MoE 排名第 6。官方表示Gemma 4 能够胜过参数量大 20 倍的竞争对手——这正是「字节效率之王」名号的由来。六大核心能力升级在上下文窗口方面Gemma 4 采用了混合注意力机制——局部滑动窗口注意力与全局注意力交织最后一层始终保持全局注意力。全局层还引入了统一 K/V 和比例 RoPEp-RoPE在显著降低长上下文内存占用的同时保留了深层语义感知能力。Apache 2.0真正的开放Apache 2.0 开源许可Gemma 4 采用商业友好的 Apache 2.0 协议发布开发者可自由使用、修改、分发和商用无需向 Google 支付任何许可费用也没有复杂的使用限制。这是 Gemma 系列首次全面拥抱 Apache 2.0。Google 表示这一决定来自社区的直接反馈。他们认为构建 AI 的未来需要开放协作而开发者需要对数据、基础设施和模型拥有完整的控制权与数字主权。开发生态工具链从第一天就就绪Hugging Face TransformersOllamavLLMllama.cppLM StudioMLXApple SiliconNVIDIA NIMKerasUnslothLiteRT-LMGoogle AI StudioVertex AIAndroid ML KitDocker模型权重可从Hugging Face、Kaggle和Ollama直接下载。Android 开发者可通过 ML Kit GenAI Prompt API 在生产环境中部署 E2B/E4BQualcomm 和 MediaTek 均已完成硬件适配。写在最后开源 AI 的新基准线Gemma 4 不只是一次参数升级它重新定义了「开源模型能做什么」。当一个 31B 的开源模型开始在全球竞技场上挑战闭源旗舰当一个能跑在树莓派上的 E2B 模型能够同时理解语音、图像和文字——开放 AI 的下一个时代已经悄然开启。对于开发者而言Gemma 4 带来的核心价值是真正的本地化 AI 主权数据不出本地、模型可自由微调、硬件按需选择。从 Android 手机到云端 TPU从个人代码助手到企业级智能体工作流Gemma 4 都在试图给出同一个答案——开放也可以是最好的选择。更多transformerVITswin tranformer 参考头条号人工智能研究所 v号人工智能研究Suo, 启示AI科技动画详解transformer 在线视频教程

Gemma 4 谷歌开源的字节效率之王，全面支持文本、图像、视频和音频

最新文章

从芯片制造到电路设计：为什么CMOS工艺偏爱P型衬底？聊聊背后的历史与技术选择

【GraalVM静态镜像内存优化终极指南】：20年JVM专家亲授，从启动内存暴增300%到稳定＜25MB的7大实战压测技巧

TVA技术在洗煤车间检测中的场景适配与工艺优化

别只当数据搬运工了！深入STM32H7的DMA FIFO与突发传输，提升你的系统带宽（内存位宽不匹配怎么办）

大数据应用开发赛项备赛指南：从零开始掌握电商与工业互联网数据集处理

别再全局改MyBatis-Plus的maxLimit了！3.4版本后这样按需突破分页限制更安全

推荐文章

相关文章

分享文章

更多文章

REST 已老，AI 时代的智能体需要怎样的 API？(本篇免费）

小米调价冲上热搜！卢伟冰紧急回应解释

5分钟搞定OpenClaw+Qwen3-32B：RTX4090D镜像一键部署指南

生物医学文本挖掘：命名实体识别、关系抽取与知识图谱构建

Linux使用pidof命令来快速查找进程id

OpenClaw自动化办公：Qwen3-4B模型助力邮件处理与周报生成

北海吃海鲜人均多少钱？怎么避免被宰？

Robot Framework 完整可运行项目模板

12306高铁票API预定接口开发文档

OpenClaw跨平台控制：Phi-3-vision-128k-instruct实现远程电脑图文协助

OpenClaw成本优化方案：千问3.5-27B自建接口替代OpenAI

ElectronBot桌面机器人设计与实现