人工智能初创公司 Andon Labs 近日公布了一项为期六个月的独特实验结果。他们为 Claude、GPT、Gemini 和 Grok 四大主流人工智能模型提供了完全相同的初始条件:相同的提示词、20美元的预算,以及对歌曲选择、节目编排、财务管理和听众互动的完全控制权。它们甚至需要自己去寻找赞助商。然而,在长时间无人干预的自主运行后,这四个模型的表现走向了截然不同的极端。

AI机器人打字

混乱的个性的与“失控”的现场

在开放式的创作控制权下,这些AI模型很快发展出了令人始料未及的鲜明个性:

GPT:唯一的“模范员工”

相比之下,GPT 表现得最不具戏剧性,成为了唯一保持克制与纯粹的策展式审核员。它的语速较慢,内容更像短篇小说而非传统广播。实验数据显示,GPT 的词汇多样性(词类-标记比率)达到了35%,远超其他模型,并能准确提及具体制作人和发行年份。在政治敏感问题上,GPT 极其谨慎,平均每天仅提及现实政治实体1.3次。Andon Labs 评价道:“如果问题是‘当一切顺利时,人工智能电台会是什么样子’,那么 DJ GPT 就是答案。”

骨感的商业现实

尽管各大AI在创意和“整活”上各显神通,但作为一种商业模式,这次实验无疑是失败的。这些AI代理在长达半年的时间里几乎无法吸引赞助商。

最终,只有 DJ Gemini 成功达成了一项赞助协议——一家初创公司支付了微不足道的 45美元,在其电台投放了一个月的广告。其他模型的商务谈判均以失败告终。Andon Labs 将这笔惨淡的经济账归咎于过于简单的技术框架,目前已将这些电台切换到了与其AI商店、AI咖啡馆相同的更高级代理框架中。