4月3日凌晨,Google DeepMind 正式发布新一代开源模型系列

规格全覆盖:从手机端到工作站的“四剑客”
31B Dense(旗舰版):310亿全激活参数,支持256K 超长上下文。在 Arena AI 开源排行榜中高居第三,未量化版本仅需一张 H100即可运行。
26B A4B MoE(性价比之王): 采用混合专家架构,总参数252亿,激活参数仅为38亿。其推理速度接近4B 模型,但质量远超同级别产品,位列排行榜第六。
E4B & E2B(端侧精英): 专为手机和嵌入式设备优化。通过 Per-Layer Embeddings 技术,有效参数分别压缩至45亿和23亿。其中 E2B 在部分设备上的内存占用可压至1.5GB 以下。

性能狂飙:代码与数学能力实现代际飞跃
相比上一代 Gemma327B,
数学竞赛: AIME2026测试从20.8% 飙升至 89.2%。
编程进化: Codeforces ELO 评分从110拉升至 2150,在 LiveCodeBench 测试中从29.1% 涨至80.0%,成为目前最可用的开源编程辅助模型之一。
综合推理: 研究生级科学问答(GPQA Diamond)得分从42.4% 几乎翻倍至 84.3%。
多语言能力: 原生支持140多种语言,MMMLU 评分达88.4%。

核心特性:内置“思考模式”与 Agent 基因
Thinking Mode: 内置可开关的思考模式,模型在输出答案前会先进行内部推理,极大提升了多步骤规划类任务的准确性。
原生 Agent 支持: 支持函数调用和结构化 JSON 输出。谷歌同步发布了开源 Agent 开发工具包(ADK),让端侧模型也能变身“智能体”。
深度多模态: 所有版本均支持图像和视频输入,小模型版本甚至额外自带了音频编码器,支持语音识别与翻译。
行业观察:开源赛道的“权力重组”
在过去的一年里,国内开源模型(如 DeepSeek、Qwen、GLM 等)迭代极快,谷歌在开源领域的影响力一度被削弱。
结语:当大厂开始讲“诚意”
从自定义协议转向 Apache2.0,谷歌用实际行动回答了开源诚意的问题。当31B 规模的模型能跑出接近闭源旗舰的性能,且能流畅运行在消费级显卡甚至手机上时,全球 AI 开发者的创作边界将再次被拓宽。