Apache 2.0 协议加持！谷歌 Gemma 4 正式开源：31B 参数性能直逼头部大模型

4月3日凌晨，Google DeepMind 正式发布新一代开源模型系列 Gemma4。此次更新距离上一代产品发布整整一年，谷歌不仅在性能上实现了“代际跨越”，更在开源诚意上放出了大招:将许可证由自有协议彻底更换为全球通用的 Apache2.0，这意味着开发者可以更自由地进行商用与二次开发。

规格全覆盖:从手机端到工作站的“四剑客”

Gemma4 此次一口气推出了四款不同规格的模型，实现了全场景覆盖:

31B Dense（旗舰版）:310亿全激活参数，支持256K 超长上下文。在 Arena AI 开源排行榜中高居第三，未量化版本仅需一张 H100即可运行。

26B A4B MoE（性价比之王）: 采用混合专家架构，总参数252亿，激活参数仅为38亿。其推理速度接近4B 模型，但质量远超同级别产品，位列排行榜第六。

E4B & E2B（端侧精英）: 专为手机和嵌入式设备优化。通过 Per-Layer Embeddings 技术，有效参数分别压缩至45亿和23亿。其中 E2B 在部分设备上的内存占用可压至1.5GB 以下。

性能狂飙:代码与数学能力实现代际飞跃

相比上一代 Gemma327B，Gemma4 的核心指标提升堪称惊人:

数学竞赛: AIME2026测试从20.8% 飙升至 89.2%。

编程进化: Codeforces ELO 评分从110拉升至 2150，在 LiveCodeBench 测试中从29.1% 涨至80.0%，成为目前最可用的开源编程辅助模型之一。

综合推理: 研究生级科学问答（GPQA Diamond）得分从42.4% 几乎翻倍至 84.3%。

多语言能力: 原生支持140多种语言，MMMLU 评分达88.4%。

核心特性:内置“思考模式”与 Agent 基因

Gemma4 不仅仅是参数的增长，更在交互逻辑上向旗舰 Gemini 看齐:

Thinking Mode: 内置可开关的思考模式，模型在输出答案前会先进行内部推理，极大提升了多步骤规划类任务的准确性。

原生 Agent 支持: 支持函数调用和结构化 JSON 输出。谷歌同步发布了开源 Agent 开发工具包（ADK），让端侧模型也能变身“智能体”。

深度多模态: 所有版本均支持图像和视频输入，小模型版本甚至额外自带了音频编码器，支持语音识别与翻译。

行业观察:开源赛道的“权力重组”

在过去的一年里，国内开源模型（如 DeepSeek、Qwen、GLM 等）迭代极快，谷歌在开源领域的影响力一度被削弱。Gemma4 的发布，标志着谷歌正通过“极致的端侧工程化”与“更彻底的协议开放”重回主战场。

结语:当大厂开始讲“诚意”

从自定义协议转向 Apache2.0，谷歌用实际行动回答了开源诚意的问题。当31B 规模的模型能跑出接近闭源旗舰的性能，且能流畅运行在消费级显卡甚至手机上时，全球 AI 开发者的创作边界将再次被拓宽。