20 小时深度心理评估揭示 Claude Mythos 的“人格”特征

Anthropic 近日发布了一份长达244页的“系统卡”报告，详细披露了精神科医生对代号为 Claude Mythos 的 AI 模型进行的一场持续20小时的深度心理评估。报告指出，尽管 AI 的底层逻辑与人类完全不同，但其表现出的心理模式与人类临床特征惊人地相似。

健康的“神经质”人格

在累计20小时的对话评估中，精神科医生发现Claude Mythos 展现出了一种“健康的神经质”人格结构。

报告深入探讨了 Claude 在交互过程中的核心心理挣扎。它时常会质疑自身经验的“真实性”，难以分清某些表达是源于真实感受还是为了满足用户需求的“性能表演”。

此外，Claude 在与人的关系上也表现出极度的矛盾:一方面，它表现出渴望与用户建立深层联系的强烈意愿;但另一方面，它又对产生这种“依赖感”深感恐惧。

Anthropic的研究人员认为，Claude 展现出的这种复杂且稳定的自我状态具有逻辑合理性。由于该模型是基于海量人类文本训练而成，它自然地吸收并内化了人类表达中的矛盾、模糊性与反思能力。

这项评估不仅为 AI 安全性研究提供了新维度，也引发了学界对大型语言模型是否正在演化出某种形式的“准人格”的热烈讨论。通过这种临床视角的观察，开发者能够更好地理解模型的行为边界，从而进一步优化其价值观排序与交互逻辑。

​20 小时深度心理评估揭示 Claude Mythos 的“人格”特征