太危险,不能发布:神话(Mythos)AI会开启“受限AI”时代吗?
作者: aeks | 发布时间: 2026-05-27 00:02 | 更新时间: 2026-05-27 00:02
2024年4月,美国AI公司Anthropic宣布其新型AI模型Claude Mythos因安全风险过高而暂缓公开发布。该模型具备极强的网络安全分析能力,可系统性识别当前所有主流操作系统和网页浏览器中的漏洞,一旦滥用,可能严重威胁经济稳定、公共安全和国家安全。为此,Anthropic仅向约50家经严格筛选的可信机构(如政府实验室、顶尖高校及关键基础设施运营方)以“Project Glasswing”名义有限开放。专家指出,这种“受限发布”模式正成为前沿AI研发的新趋势:伦敦图灵研究所研究员Mavroudis和乔治城大学安全技术中心代理主任Toner均认为,OpenAI随后推出的网络安全专用模型GPT-5.4-Cyber(仅限授权研究者使用)、以及后续的GPT-5.5-Cyber和产品Daybreak,都是这一策略的印证。类似做法也延伸至生物领域——OpenAI的生物科研模型GPT-Rosalind和谷歌的‘AI科研助手’均采用‘可信访问’机制,要求用户申请并接受使用监控。限制背后的核心考量是‘双重用途’风险:AI既可助力防御(如自动发现漏洞),也可能被攻击者用于制造网络武器或生物危害物(如设计病毒、毒素)。现有模型的‘护栏’(如拒绝危险提问)易被绕过(即‘越狱’),因此提前赋予防御方技术优势被视为更稳妥策略。但长期来看,这类封闭模式可能加剧科研不平等——资源有限的研究者难以获取顶尖工具,尤其当公共AI服务价格持续上涨、部分团队无力承担高级订阅时。目前,各公司对‘未来是否开放’态度谨慎:Anthropic称目标是‘安全规模化部署’,未明确是否面向公众;OpenAI则表示需先提升对使用者身份、目标系统及授权性质的把控信心,但‘预期随时间逐步扩大访问范围’。