标签: 模型滥用防控

该标签下共有 1 篇文章

作者: aeks | 发布时间: 2026-06-12 04:01

Anthropic最初对AI模型Claude Fable 5采取了“隐形降级”策略，暗中削弱部分用户（尤其是AI研究者）的使用体验，以阻止他人用其训练竞争性AI模型；此举引发强烈批评后，公司宣布改为“显性防护”——当检测到用户可能用于前沿AI开发时，会明确提示并拒绝或降级服务。