阿里正式发布了全新多模态大模型 Qwen3.7-Plus。该模型在 Qwen3.7强大的文本能力基础上,全面升级了视觉-语言能力,并将其统一为一体化的智能体基座。作为一款多模态交互混合智能体,Qwen3.7-Plus 能够无缝融合 GUI(图形用户界面)与 CLI(命令行界面)交互,实现了从前端原型到复杂软件工程的端到端自动化。

QQ20260602-091627.jpg

权威视觉模型榜单 Vision Arena 中,凭借 Qwen3.7-Plus 的强劲表现,阿里已成功跻身全球前五、中国第一

核心技术能力与评测表现

Qwen3.7-Plus 的核心优势在于将“看、想、写、做、验”整合进统一的循环中,在三大方向展现出顶尖性能:

QQ20260602-091701.jpg

颠覆性的真实应用场景

发布会同步展示了基于 Qwen3.7-Plus 构建的多个前沿智能体系统:

  1. APP 全链路自主开发: 在测试中,Hybrid-Agent 系统持续稳定运行11+ 小时,触发调用超1000次,自主生成超10,000行代码,全程无人工干预地完成了从需求文档到测试、部署的英语单词学习 APP 研发闭环。

  2. 桌面应用高保真复刻: 智能体通过自主交互 macOS 原生“股市”应用并理解布局,自动编写 SwiftUI 源码并接入真实行情 API,最终10项功能验证测试全部通过,完美复现了原生的暗色主题与交互体验。

  3. 云控制台无人值守运维: 基于 Qwen3.7-Plus 开发的“Qwen for Chrome”浏览器插件,能够理解非专业用户的自然语言需求,自主进入阿里云控制台完成 ECS 服务器的比价、选型、配置、购买,甚至能自主处理停机扩容等复杂运维升级。

目前,Qwen3.7-Plus 已正式通过阿里云百炼Qwen Studio对外提供服务。无论通过 Claude Code、OpenClaw 还是 Qwen Code 等框架部署,该模型均能保持稳定的跨框架泛化表现,为下一代 embodied(具身)场景与生产力工作流自动化打下了坚实基础。