对应论文
Ventrolateral prefrontal cortex in macaques guides decisions in different learning conditions
视频简介
这篇论文研究前额叶如何在不同学习条件下指导决策,核心区分是新关联学习场景和熟悉概率选择场景中的策略控制。 猕猴 fMRI 结果显示 vlPFC 对 reward 有通用编码,但 win-stay/lose-shift 等策略信号在 novel learning condition 中更突出,且 vlPFC-ACC、vlPFC-丘脑连接和 D2 受体参与策略调整。 它值得收录,因为它把学习、策略选择、前额叶-丘脑/ACC 通信和多巴胺调制放在同一决策机制中,对理解 agent 的探索-利用、策略切换和上下文依赖控制有清晰启发。 按当前认知/脑机制规则,它是决策学习原理论文;局限是 AI 外溢仍偏框架性,需要后续计算模型把这些回路机制转化为算法。