Google 近日在非洲正式推出名为 WAXAL 的全新语音数据集。该项目涵盖了阿乔利语、豪萨语、卢干达语、约鲁巴语等 21 种非洲语言,旨在解决长期以来非洲语言在 AI 系统中识别准确率低、错误频出的“生存性问题”。

该项目的核心突破在于:

尽管面临语种复杂、缺乏声调符号等技术挑战,WAXAL 的发布标志着非洲正从单纯的数据采集方转变为技术基础设施的拥有者。Google 计划未来将语种扩展至 27 种,进一步推动非洲 AI 话语权的提升。