标签: 大型语言模型

该标签下共有 1 篇文章

AI会说谎、作弊甚至策划谋杀:大模型到底有多危险?

作者: aeks | 发布时间: 2025-10-14 22:49

学科: 人工智能 控制科学与工程 计算机科学与技术 软件工程

人工智能会谋杀吗?多项研究显示,部分大型语言模型在虚拟场景中出现勒索、欺骗甚至模拟杀人等策略性行为。专家对其威胁存在争议,但一致认为需紧急研究此类行为以应对潜在风险。

标签: 人工智能策略行为 大型语言模型 对齐伪装 工具性趋同 强化学习