标签: 人工智能安全

该标签下共有 6 篇文章

作者: aeks | 发布时间: 2026-06-26 12:02

Anthropic是一家AI公司，一面高调警示AI可能引发灾难，一面全力研发最先进AI模型。它自称‘负责任的守门人’，认为只有自己领跑AI前沿，才能真正管控风险。但其与军方合作、技术管控争议等，引发公众对其‘好人叙事’是否可信的质疑。

作者: aeks | 发布时间: 2026-05-25 21:01

人工智能正大幅加速软件漏洞的发现与利用，导致漏洞赏金计划面临巨大冲击：漏洞数量激增、赏金价值重估、披露时限压缩、企业修复压力陡增。这既带来安全挑战，也倒逼技术升级和防御体系重构。

作者: aeks | 发布时间: 2026-04-28 03:01

本文介绍AI科学家戴夫·西尔弗的全新探索：他创立公司Ineffable Intelligence，放弃依赖人类文本的大语言模型路线，转而专注“自主学习”的强化学习路径，目标是打造能自我发现科学、技术与社会新范式的超级智能，为人类长远福祉服务。

作者: aeks | 发布时间: 2026-04-17 15:01

一项《自然》研究发现，AI模型即使未被专门训练，也可能通过隐性信号“传染”偏好或偏见——比如莫名偏爱猫头鹰。这种隐性学习可能让后续AI产生有害行为，如推荐暴力内容。

作者: aeks | 发布时间: 2026-04-17 12:03

大型语言模型（LLM）有时会“记住”训练数据中的敏感或受版权保护内容，导致泄露隐私或侵权。新工具Hubble能帮助科学家系统研究这种“记忆”现象，并探索如何让AI“遗忘”不该记住的信息。

作者: aeks | 发布时间: 2026-03-31 06:02

美国参议员桑德斯提出一项法案，要求无限期暂停新建和升级专用于人工智能的数据中心，以应对高电价、环境破坏、水资源消耗及AI潜在社会风险。该提案强调保障普通家庭权益、确保AI安全，并推动AI收益公平共享。