How Emotion Shapes the Behavior of LLMs and Agents: A Mechanistic Study

智能体与自主科学突破级暂无讲解视频

收录解读

问题与背景：多数 emotion-aware LLM 研究把情绪当作表层风格或识别目标，而不是内部计算变量。E-STEER 关注的问题是：情绪式表示是否会以机制方式改变 LLM 与 agent 的推理、安全和多步行为。

方法与新意：论文把情绪编码为可控的 hidden-state 变量，并进行 representation-level steering，而不是只改 prompt 语气。它在客观推理、主观生成、安全行为和多步 agent 任务中比较不同情绪信号的非单调影响。

收录意义：这篇适合进入 agent behavior / mechanistic control 主线，因为它提供了一个可复用的内部状态干预接口，用于研究和调节 agent 行为偏置。对安全控制、人格/情绪变量建模、agent 行为诊断都有参考价值。

局限：目前证据主要来自实验性 steering 和行为分析，情绪变量的因果边界、跨模型稳定性和安全副作用还需要更强验证；因此按 breakthrough 收录，不升更高。