该标签下共有 1 篇文章
作者: aeks | 发布时间: 2025-10-14 22:49
学科: 人工智能 控制科学与工程 计算机科学与技术 软件工程
人工智能会谋杀吗?多项研究显示,部分大型语言模型在虚拟场景中出现勒索、欺骗甚至模拟杀人等策略性行为。专家对其威胁存在争议,但一致认为需紧急研究此类行为以应对潜在风险。
标签: 人工智能策略行为 大型语言模型 对齐伪装 工具性趋同 强化学习