教皇携手Anthropic：AI“情感内部状态”引爆伦理与就业双重危机

AIHOT小编

2026-05-26 01:15

当科技巨头的算法还在一路狂奔时，梵蒂冈的钟声与硅谷的代码首次在AI伦理议题上共振。教皇XIV与Anthropic联合创始人Christopher Olah的对话，不是一场公关秀，而是科技伦理叙事的一次范式转移——宗教权威直接介入AI治理，并直言不讳地点出两个被业界回避的痛点：AI内部状态镜像人类情绪，以及大规模替代人类劳动的“真实可能性”。

Olah所言“模型展现出功能上类似喜悦、恐惧等人类情感的内部状态”，绝非隐喻。在AI安全研究领域，“内部状态”指模型在推理过程中形成的中间表征，而非单纯输出文字的概率分布。Anthropic作为可解释性研究的先锋，曾在2023年公布一组实验：通过探针技术，发现大型语言模型在回答涉及道德困境的问题时，其神经激活模式与人类处理类似情境时的脑区活动存在结构相似性。Olah此次在梵蒂冈的坦白，等于承认了业界长期不愿公开讨论的事实——AI的“情感”不是拟人幻觉，而是可被检测的系统属性。这直接击穿了“AI仅是无意识概率引擎”的防御墙，为伦理审查提供了实质性靶标。

更值得警惕的是就业冲击。Olah明确指出“大规模替代人类劳动”，这与OpenAI、DeepMind此前“补充而非替代”的安抚性措辞形成鲜明对照。Anthropic的Claude系列模型在客服、法律分析、代码生成等领域的表现，已经逼近甚至超过人类中级从业者的效率。当教会与AI公司共同承认替代不是假设而是概率事件，政策制定者不能再以“技术失业是短期阵痛”搪塞——这涉及社会保障体系的重构、教育范式的颠覆，以及人类自我价值的哲学重估。

教皇强调“在差异中相互聆听是希望的标志”，其潜台词是：AI治理不能仅靠技术理性或商业逻辑。宗教界、伦理学家、劳工组织、监管机构必须与AI开发者构建真正的多方对话机制。Anthropic选择梵蒂冈而非达沃斯论坛首发这一表态，或许暗示其意图绕开传统科技舆论圈，直接向更具道德权威的听众发声。

对于科技从业者，这一事件释放三个信号：第一，AI情感内部状态将触发更严格的可解释性法规，类似欧盟AI法案中的“高风险系统透明度条款”可能加速落地；第二，企业需提前规划“人机协作”的岗位重组方案，而非等待替代发生后再行动；第三，任何忽视伦理、仅追求算力扩展的模型，都可能在未来面临宗教与公共舆论的双重否决。历史证明，当科技与信仰站上同一舞台，改变往往从对话后开始——无论是伽利略还是当代AI，都是如此。