前扣带皮层如何通过经验和观察积累信息

作者: aeks | 发布时间: 2026-01-11 21:02 | 更新时间: 2026-01-11 21:02

前扣带皮层如何通过经验和观察积累信息

认知的一大特征是推断经验背后隐藏原因的能力。例如，醒来时胃部不适，你可能会思考是食物中毒还是流感——恶心或发烧等症状暗示不同原因，你也可能参考他人经验，比如同事最近得过流感，或晚餐同伴出现类似症状。尽管整合经验性和观察性证据来推断隐藏原因的能力明确存在，但实现这种复杂计算的神经机制尚不明确。

前扣带回（ACC）被认为在基于证据的决策中起核心作用。它携带与结果历史、表现监控、行动和策略选择以及对关联和情境的信念相关的信号。值得注意的是，ACC的表征能在较长时间尺度上持续存在，并整合跨事件和经验的信息。这些发现结合相关因果研究，为ACC编码环境中与行为相关的潜在原因信念提供了有力证据。

我们对观察性推理和学习的计算及神经基础了解较少。一些研究考察了杏仁核、纹状体和许多皮质区域中观察到的奖励和惩罚的神经信号，其中ACC是支持替代性强化和观察性恐惧条件反射的关键区域。因此，ACC可能在经验性和观察性场景中都具有更普遍的信念更新作用。然而，大多数观察性学习研究依赖相对简单的任务，要么不需要推断潜在原因，要么不涉及经验性和观察性证据的整合，因此对这两种证据的神经表征的异同以及它们如何整合形成关于世界潜在状态的信念知之甚少。

在此，我们通过双人信念更新游戏，结合人类行为、灵长类神经生理学和神经建模来解决这些问题。行为结果显示，人类和猴子均存在经验性和观察性证据之间的常见不对称性。ACC记录揭示了来自自身和他人经验的证据如何整合为连贯的群体神经活动模式，逐次试验支持参与者的信念和行为。此外，与自身经验、观察和整合信念相关的群体活动组织解释了这种行为不对称。

**行为任务与表现**：我们为人类和猴子设计了双人游戏。每个试验包含两个阶段。第一阶段，玩家用操纵杆独立选择左右“竞技场”；选择至关重要，因为只有一个竞技场可能最终带来奖励。第二阶段，随机指定一名玩家为“行动者”，通过操纵杆控制所选竞技场内的化身收集掉落代币以获取奖励（概率性，取决于竞技场和代币捕获数量），另一名“观察者”观看过程但无奖励。正确的竞技场以分块方式切换。行动者和观察者的感官体验尽可能匹配，确保证据积累的不对称性反映内部而非外部因素。

来自10名人类（5对）和2只猴子的数据显示，他们先学习单人任务（表现稳定），再进行双人任务。隐藏的区块切换后表现立即下降，随后几轮恢复，表明信念更新。“唯我论”代理（忽略观察者试验）的表现比双人 sessions 差，显示对观察者试验的关注（猴子的眼动数据也证明了这一点）。

**人类和猴子理性整合经验**：将行为与最优“先知”模型比较，参与者的切换概率（P(switch)）在奖励后较低，随连续无奖励试验增加，并随区块内试验位置增加（与先知模型一致）。他们还将捕获代币更多的无奖励试验视为更强的切换证据（在人类中更显著）。在不一致试验（选择相反竞技场）中，行动者更可能切换，表明受他人决策影响。

**人类和猴子对观察性证据的权重较低**：与先知模型（同等对待行动者和观察者结果）不同，人类和猴子对观察性证据的权重低于经验性证据，猴子的这种不对称性更强（可能因行动者猴子获得果汁奖励）。这并非因观察者看屏幕时间少，且反映在人类的信心报告中。

**扣带回中的证据整合**：记录猴子的ACC神经活动发现，大多数任务调制神经元对多种变量敏感，对行动者和观察者结果具有混合选择性。许多神经元对行动者结果敏感（54.7%），较少对观察者结果敏感（29.4%），且存在重叠。行动者和观察者结果编码的一致性从结果阶段到选择阶段增加，与逐渐整合为无关身份的结果表征一致。

分析单个神经元的结果整合，17.6%对行动者和观察者具有同符号结果选择性的神经元，在两次连续无奖励试验（2NR）中比一次（1NR）调制更强，其中91%对观察者试验敏感。行动者试验中的放电率调制强于观察者试验，与行为不对称一致。

**双人证据整合的神经几何结构**：群体水平分析识别出“切换证据（SE）”维度，其活动随导致切换的试验增加，可预测切换行为。该维度携带行动者和观察者的结果信息，行动者试验的回归斜率更陡（与行为不对称一致）。

考察ACC输入几何结构，我们测试了两种假设：H1（共享无关身份的结果输入+独立身份输入，平行编码维度）与H2（独立的经验性/观察性结果输入，正交维度）。循环神经网络（RNN）模型显示，ACC群体活动角度与H2（正交）匹配，存在独立输入通路。输入投射是混合的（非分离亚群），对齐/反对齐神经元解释了正交性。

SE维度与行动者结果的角度小于与观察者结果的角度，解释了行为不对称：角度越小，证据整合越强。跨 sessions 的神经角度与行为敏感性负相关支持了这一点。

**讨论**：ACC整合经验性和观察性结果以更新环境状态信念。行动者/观察者结果的正交子空间防止干扰；混合投射促进整合。神经编码在 trial 间隔期间变化，行动者/观察者结果向量从结果阶段到选择阶段趋于对齐。观察性证据权重较低的行为不对称在ACC角度差异中存在神经关联。这项工作为理解社会学习的神经机制奠定基础，未来可研究同伴技能、知识和社会等级等认知因素的影响。

DOI: 10.1038/s41586-025-09885-0

标签: 信念更新社会学习神经表征证据整合