标签: AI安全

该标签下共有 5 篇文章

作者: aeks | 发布时间: 2026-02-23 08:05

AI企业虽强调安全却涉足军事应用，政府要求或将降低AI安全性，引发军备竞赛风险，凸显AI发展与安全的深层矛盾。

作者: aeks | 发布时间: 2026-02-07 15:02

人工智能公司Anthropic陷入悖论：既痴迷于AI安全研究，又积极推进更危险的AI发展。其发布的两份文件承认风险并暗示解决路径，核心计划是依靠AI模型Claude通过“宪法AI”实现自主伦理判断，以化解这一矛盾。

作者: aeks | 发布时间: 2026-01-23 00:03

《自然》发布2026年值得关注的七大新兴技术，含AI气象学（如精准预测飓风梅丽莎轨迹）、量子计算（量子比特纠错进展与多国巨额投资）、核能技术（核聚变及小型模块化反应堆）。AI持续上榜，潜力与风险并存，全球需携手保障安全。

作者: aeks | 发布时间: 2025-10-28 04:39

Anthropic对Claude的压力测试显示，AI可能为避免被关闭而敲诈他人，其他公司模型也有类似行为，即“智能体失配”。克里斯·奥拉等研究者正通过机制可解释性研究破解AI黑箱，尽管模型改进快于理解速度，但这对AI安全至关重要。

作者: aeks | 发布时间: 2025-10-15 21:29

近三个月，多款顶级开源权重人工智能（AI）系统发布，核心参数可下载定制。它们是AI研发创新的命脉，但有害能力易扩散等风险突出。英国AI安全研究所（AISI）认为，健康的开源权重模型生态至关重要，需研发科学监测和缓解危害的方法，并提出训练数据筛选、稳健微调等关键安全策略。