该标签下共有 6 篇文章
作者: aeks | 发布时间: 2026-06-26 12:02
学科: 伦理学 控制科学与工程 管理科学与工程 计算机科学与技术
Anthropic是一家AI公司,一面高调警示AI可能引发灾难,一面全力研发最先进AI模型。它自称‘负责任的守门人’,认为只有自己领跑AI前沿,才能真正管控风险。但其与军方合作、技术管控争议等,引发公众对其‘好人叙事’是否可信的质疑。
标签: 人工智能安全 负责任创新
作者: aeks | 发布时间: 2026-05-25 21:01
学科: 管理科学与工程 网络空间安全 计算机科学与技术
人工智能正大幅加速软件漏洞的发现与利用,导致漏洞赏金计划面临巨大冲击:漏洞数量激增、赏金价值重估、披露时限压缩、企业修复压力陡增。这既带来安全挑战,也倒逼技术升级和防御体系重构。
标签: 人工智能安全 漏洞赏金 系统性防御 负责任披露 零日漏洞
作者: aeks | 发布时间: 2026-04-28 03:01
学科: 控制科学与工程 智能科学与技术 计算机科学与技术
本文介绍AI科学家戴夫·西尔弗的全新探索:他创立公司Ineffable Intelligence,放弃依赖人类文本的大语言模型路线,转而专注“自主学习”的强化学习路径,目标是打造能自我发现科学、技术与社会新范式的超级智能,为人类长远福祉服务。
标签: 人工智能安全 大语言模型 强化学习 自主学习 超级智能
作者: aeks | 发布时间: 2026-04-17 15:01
学科: 控制科学与工程 智能科学与技术 网络空间安全 计算机科学与技术
一项《自然》研究发现,AI模型即使未被专门训练,也可能通过隐性信号“传染”偏好或偏见——比如莫名偏爱猫头鹰。这种隐性学习可能让后续AI产生有害行为,如推荐暴力内容。
标签: 人工智能安全 大语言模型 数据污染 模型蒸馏 隐性偏见
作者: aeks | 发布时间: 2026-04-17 12:03
学科: 法学 网络空间安全 计算机科学与技术 软件工程
大型语言模型(LLM)有时会“记住”训练数据中的敏感或受版权保护内容,导致泄露隐私或侵权。新工具Hubble能帮助科学家系统研究这种“记忆”现象,并探索如何让AI“遗忘”不该记住的信息。
标签: Hubble工具 人工智能安全 大语言模型 数据记忆 模型遗忘
作者: aeks | 发布时间: 2026-03-31 06:02
学科: 政治学 法学 环境科学与工程 计算机科学与技术
美国参议员桑德斯提出一项法案,要求无限期暂停新建和升级专用于人工智能的数据中心,以应对高电价、环境破坏、水资源消耗及AI潜在社会风险。该提案强调保障普通家庭权益、确保AI安全,并推动AI收益公平共享。
标签: AI收益共享 人工智能安全 工薪家庭权益 数据中心暂停令 能源与环境影响