太危险，不能发布：神话（Mythos）AI会开启“受限AI”时代吗？

作者: aeks | 发布时间: 2026-05-27 00:02 | 更新时间: 2026-05-27 00:02

2024年4月，美国AI公司Anthropic宣布其新型AI模型Claude Mythos因安全风险过高而暂缓公开发布。该模型具备极强的网络安全分析能力，可系统性识别当前所有主流操作系统和网页浏览器中的漏洞，一旦滥用，可能严重威胁经济稳定、公共安全和国家安全。为此，Anthropic仅向约50家经严格筛选的可信机构（如政府实验室、顶尖高校及关键基础设施运营方）以“Project Glasswing”名义有限开放。专家指出，这种“受限发布”模式正成为前沿AI研发的新趋势：伦敦图灵研究所研究员Mavroudis和乔治城大学安全技术中心代理主任Toner均认为，OpenAI随后推出的网络安全专用模型GPT-5.4-Cyber（仅限授权研究者使用）、以及后续的GPT-5.5-Cyber和产品Daybreak，都是这一策略的印证。类似做法也延伸至生物领域——OpenAI的生物科研模型GPT-Rosalind和谷歌的‘AI科研助手’均采用‘可信访问’机制，要求用户申请并接受使用监控。限制背后的核心考量是‘双重用途’风险：AI既可助力防御（如自动发现漏洞），也可能被攻击者用于制造网络武器或生物危害物（如设计病毒、毒素）。现有模型的‘护栏’（如拒绝危险提问）易被绕过（即‘越狱’），因此提前赋予防御方技术优势被视为更稳妥策略。但长期来看，这类封闭模式可能加剧科研不平等——资源有限的研究者难以获取顶尖工具，尤其当公共AI服务价格持续上涨、部分团队无力承担高级订阅时。目前，各公司对‘未来是否开放’态度谨慎：Anthropic称目标是‘安全规模化部署’，未明确是否面向公众；OpenAI则表示需先提升对使用者身份、目标系统及授权性质的把控信心，但‘预期随时间逐步扩大访问范围’。

DOI: 10.1038/d41586-026-01617-2

标签: AI安全双重用途技术受限发布科研公平性网络安全AI