该标签下共有 1 篇文章
作者: aeks | 发布时间: 2026-06-12 04:01
学科: 管理科学与工程 网络空间安全 计算机科学与技术
Anthropic最初对AI模型Claude Fable 5采取了“隐形降级”策略,暗中削弱部分用户(尤其是AI研究者)的使用体验,以阻止他人用其训练竞争性AI模型;此举引发强烈批评后,公司宣布改为“显性防护”——当检测到用户可能用于前沿AI开发时,会明确提示并拒绝或降级服务。
标签: AI安全治理 开源AI研究 显性防护 模型滥用防控 隐形降级