网络媒体和大语言模型中的年龄与性别偏见
作者: aeks | 发布时间: 2025-10-13 14:09 | 更新时间: 2025-10-13 14:09

尽管很少有人否认刻板印象(对社会群体的概括)有害,但一个核心问题仍存争议:常见刻板印象是准确反映现实还是社会扭曲的结果?一些人认为刻板印象能捕捉群体可观察特征,否则不会广泛传播;另一些人则认为其常被夸大或虚构。评估刻板印象准确性很困难,因为它既涉及统计关联(如群体特征相关性),也包含无明确客观标准的规范性判断(如群体优劣),即便统计关联,也常因缺乏大规模量化文化数据难以验证。
本研究以年龄相关性别偏见为切入点克服这些局限,年龄可作为客观锚点评估刻板印象准确性,并关联网络中男女年龄呈现的大规模统计偏差。一方面,有充分证据表明老年女性面临性别与年龄的双重偏见(即“性别化年龄歧视”),政策报告、媒体报道和职场访谈显示她们在各行业 hiring 和晋升中受歧视,且存在将女性与年轻化期望关联的普遍统计偏差(如“ beauty tax ”、 infantilizing 代词使用)。另一方面,这种女性 - 年轻化关联与社会经济现实矛盾:美国女性寿命比男性长,人口普查数据显示过去十年各职业男女比例与年龄无相关性,劳动力中男女年龄分布也无明显差异,部分调查甚至显示某些组织中老年女性受刻板印象影响小于男性。
现有研究局限于小规模调查或特定行业观察,难以反映文化层面全貌。本研究通过收集主流数字媒体的图像、视频和文本数据,构建大规模文化层面的年龄 - 性别关联数据集。在视觉内容方面,分析五大平台超百万图像/视频发现,无论通过人工判断、机器学习还是客观数据(如名人真实年龄),女性均被呈现得比男性年轻,尤其在销售、资源和管理等高地位行业,谷歌图片的年龄差距远大于人口普查数据,且地位和收入越高的职业,这种扭曲越严重。
在文本方面,分析包括GPT - 2在内的9个语言模型发现,社会类别与男性的关联度和与年龄的关联度呈强正相关(即越男性化的类别越与年长关联),且这种关联可预测人口普查中的年龄分布,表明其并非单一模型特性。
算法放大效应实验显示:全国代表性实验(n=459)发现,谷歌图片搜索职业图像会加剧参与者的年龄相关性别偏见及 hiring 偏好;ChatGPT生成简历时,假设女性更年轻、经验更少,且对老年男性申请人的评分更高。
本研究表明,性别和年龄在互联网及其算法中被联合扭曲,揭示了不平等抗争中的关键挑战与机遇,强调需关注多模态、大规模数据中的偏见,以及算法在强化社会现实扭曲中的作用。