Kimi杨植麟:大模型训练进入AI主导研究的第三阶段

月之暗面创始人杨植麟在2026年3月25日举办的中关村论坛年会上明确指出，大模型训练正迈入由AI主导研究的第三个关键阶段。这一范式转移标志着大模型研发正从依赖天然数据与人工标注，向高度自动化的自我进化演进。

机器人人工智能 AI

回顾技术路径，杨植麟将大模型演进划分为三个时期:三年前的第一阶段主要依赖互联网天然数据及少量价值观对齐的人工标注;去年的第二阶段则侧重于大规模强化学习，由研究员精选高质量任务以提升模型性能。进入2026年，AI研发方式发生根本性变革，研究员的角色正向“AI算力调度者”转变。在这一新阶段，研发过程将由AI利用大量Token自主合成新任务与环境，并定义最适宜的奖励参数，甚至深度参与探索全新的网络架构。

这一趋势预示着AI研发效率将进入指数级加速期。月之暗面表示，其核心产品Kimi将致力于推动智能技术边界，并与开源社区共同构建协同进化的技术生态。从“人教AI”到“AI导研”的转变，不仅是训练方法的升级，更是通用人工智能（AGI）实现路径中从被动学习向自主探索跨越的重要里程碑。