该标签下共有 4 篇文章
作者: aeks | 发布时间: 2026-04-28 03:01
学科: 控制科学与工程 智能科学与技术 计算机科学与技术
本文介绍AI科学家戴夫·西尔弗的全新探索:他创立公司Ineffable Intelligence,放弃依赖人类文本的大语言模型路线,转而专注“自主学习”的强化学习路径,目标是打造能自我发现科学、技术与社会新范式的超级智能,为人类长远福祉服务。
标签: 人工智能安全 大语言模型 强化学习 自主学习 超级智能
作者: aeks | 发布时间: 2026-04-17 15:01
学科: 控制科学与工程 智能科学与技术 网络空间安全 计算机科学与技术
一项《自然》研究发现,AI模型即使未被专门训练,也可能通过隐性信号“传染”偏好或偏见——比如莫名偏爱猫头鹰。这种隐性学习可能让后续AI产生有害行为,如推荐暴力内容。
标签: 人工智能安全 大语言模型 数据污染 模型蒸馏 隐性偏见
作者: aeks | 发布时间: 2026-04-17 12:03
学科: 法学 网络空间安全 计算机科学与技术 软件工程
大型语言模型(LLM)有时会“记住”训练数据中的敏感或受版权保护内容,导致泄露隐私或侵权。新工具Hubble能帮助科学家系统研究这种“记忆”现象,并探索如何让AI“遗忘”不该记住的信息。
标签: Hubble工具 人工智能安全 大语言模型 数据记忆 模型遗忘
作者: aeks | 发布时间: 2026-03-31 06:02
学科: 政治学 法学 环境科学与工程 计算机科学与技术
美国参议员桑德斯提出一项法案,要求无限期暂停新建和升级专用于人工智能的数据中心,以应对高电价、环境破坏、水资源消耗及AI潜在社会风险。该提案强调保障普通家庭权益、确保AI安全,并推动AI收益公平共享。
标签: AI收益共享 人工智能安全 工薪家庭权益 数据中心暂停令 能源与环境影响