如何切换自动驾驶与探索模式？纽约大学等用 fMRI 锁定前额叶决策开关 | DAST Papers

对应论文

Ventrolateral prefrontal cortex in macaques guides decisions in different learning conditions

视频简介

这篇论文研究前额叶如何在不同学习条件下指导决策，核心区分是新关联学习场景和熟悉概率选择场景中的策略控制。猕猴 fMRI 结果显示 vlPFC 对 reward 有通用编码，但 win-stay/lose-shift 等策略信号在 novel learning condition 中更突出，且 vlPFC-ACC、vlPFC-丘脑连接和 D2 受体参与策略调整。它值得收录，因为它把学习、策略选择、前额叶-丘脑/ACC 通信和多巴胺调制放在同一决策机制中，对理解 agent 的探索-利用、策略切换和上下文依赖控制有清晰启发。按当前认知/脑机制规则，它是决策学习原理论文；局限是 AI 外溢仍偏框架性，需要后续计算模型把这些回路机制转化为算法。

外部视频链接

论文链接

论文详情页