微软近日为 Microsoft365Copilot 的研究员工具(Researcher)发布了重磅功能 Critique,首次实现 GPT 与 Claude 的同台协作。这一创新打破了单一模型的局限性,通过多模型协同作战来完成复杂的学术研究与数据处理任务。
在这一工作流中,GPT 凭借强大的文本生成能力负责撰写研究初稿。随后,Claude 则接棒担任“严苛审稿人”,按照专业学术标准对内容的准确性、完整性进行深度核查。

引入“理事会”机制,通过多模协同消除 AI 幻觉
除了双向互审,微软还引入了创新的“理事会”(Council)机制。该机制允许物理隔绝的多个模型独立进行研究,最后由一个专门的“裁判模型”对各方成果进行对比评估。
测试数据 DRACO 显示,这种多智能体协作的效果显著优于任何单一模型。通过不同算法之间的取长补短,该系统能有效过滤错误信息,大幅降低了困扰行业已久的“AI 幻觉”问题。
从通用工具转向专业代理,构建 AI 产业新生态
业内分析认为,微软此举标志着 AI 助手正在从通用型工具向专业化、行业化的“数字员工”演进。GPT 擅长创意与生成,Claude 侧重安全与严谨,两者的互补为企业级高可靠应用树立了新标杆。
通过与 NVIDIA 及 Anthropic 的深度战略合作,微软正在编织一张庞大的 AI 生态网。未来的行业竞争将不再是孤立模型的参数比拼,而是看谁能构建出更高效、更稳定的多智能体协同生态系统。