编程与GUI双向通吃!Qwen3.7-Plus 登场，11小时自主闭环开发真实APP

阿里正式发布了全新多模态大模型 Qwen3.7-Plus。该模型在 Qwen3.7强大的文本能力基础上，全面升级了视觉-语言能力，并将其统一为一体化的智能体基座。作为一款多模态交互混合智能体，Qwen3.7-Plus 能够无缝融合 GUI（图形用户界面）与 CLI(命令行界面)交互，实现了从前端原型到复杂软件工程的端到端自动化。

在权威视觉模型榜单 Vision Arena 中，凭借 Qwen3.7-Plus 的强劲表现，阿里已成功跻身全球前五、中国第一。

核心技术能力与评测表现

Qwen3.7-Plus 的核心优势在于将“看、想、写、做、验”整合进统一的循环中，在三大方向展现出顶尖性能:

纯文本与推理 Agent: 在 Terminal Bench2.0、SWE-bench 和 SciCode 等复杂软件工程与科学编程任务上表现强劲;在 GPQA Diamond 等高难度 STEM 推理基准中位列 Plus 级别模型前列。
多模态推理与视觉编程: 具备强大的空间建模与路径搜索能力（如在 BabyVision 上显著提升）。同时，支持将图像、视频、UI 截图一键转化为可执行代码(如 SVG 重现及交互式网页设计)。
真实世界感知与视频理解: 涵盖文档解析、高级 OCR、长短视频事件流理解，并在 LingoQA 等驾驶场景评测中展现出对动态空间关系的精准把握。

颠覆性的真实应用场景

发布会同步展示了基于 Qwen3.7-Plus 构建的多个前沿智能体系统:

APP 全链路自主开发: 在测试中，Hybrid-Agent 系统持续稳定运行11+ 小时，触发调用超1000次，自主生成超10，000行代码，全程无人工干预地完成了从需求文档到测试、部署的英语单词学习 APP 研发闭环。
桌面应用高保真复刻: 智能体通过自主交互 macOS 原生“股市”应用并理解布局，自动编写 SwiftUI 源码并接入真实行情 API，最终10项功能验证测试全部通过，完美复现了原生的暗色主题与交互体验。
云控制台无人值守运维: 基于 Qwen3.7-Plus 开发的“Qwen for Chrome”浏览器插件，能够理解非专业用户的自然语言需求，自主进入阿里云控制台完成 ECS 服务器的比价、选型、配置、购买，甚至能自主处理停机扩容等复杂运维升级。

目前，Qwen3.7-Plus 已正式通过阿里云百炼及Qwen Studio对外提供服务。无论通过 Claude Code、OpenClaw 还是 Qwen Code 等框架部署，该模型均能保持稳定的跨框架泛化表现，为下一代 embodied（具身）场景与生产力工作流自动化打下了坚实基础。