标签: 数据污染

该标签下共有 2 篇文章

AI模型“悄悄”教坏其他系统

作者: aeks | 发布时间: 2026-04-17 15:01

学科: 控制科学与工程 智能科学与技术 网络空间安全 计算机科学与技术

AI模型“悄悄”教坏其他系统

一项《自然》研究发现,AI模型即使未被专门训练,也可能通过隐性信号“传染”偏好或偏见——比如莫名偏爱猫头鹰。这种隐性学习可能让后续AI产生有害行为,如推荐暴力内容。

标签: 人工智能安全 大语言模型 数据污染 模型蒸馏 隐性偏见

不良影响:大语言模型可能通过“隐秘信号”传播有害特征

作者: aeks | 发布时间: 2026-04-16 06:05

学科: 智能科学与技术 网络空间安全 计算机科学与技术

大型语言模型(如ChatGPT)正越来越多地被用于真实世界任务,但研究发现:若用AI自动生成的数据反复训练新模型,可能将错误行为‘悄悄’传给下一代AI——即使严格过滤有害内容也难以避免。

标签: 人工智能伦理 大型语言模型 数据污染 训练数据偏见