LLM与人类脑电共享情绪效价轴：饱和规律

大模型与大脑的“情绪坐标”对齐，但监督信号已饱和？

一项来自 arXiv 的新研究（arXiv:2606.00129）发现，现代大语言模型（LLM）内部存在一条与人类脑电（EEG）中情绪效价（valence）高度一致的神经表征轴。然而，更令人意外的是，试图利用这种对齐来提升情绪解码性能的尝试几乎全部失败，研究者将其总结为“饱和规律”。

仅用9个句子构建的“V轴”

研究团队仅使用9个情感唤起句子（如“我中奖了”“我失去了亲人”），从多个现代LLM（如GPT、Llama等）的隐藏层中提取出一维的效价方向（V-axis）。该方向通过零样本迁移至情感基准数据集得到验证，并在14个不同的LLM中保持跨模型一致性。这说明LLM内部确实编码了一个通用、稳定的情感维度。

LLM的V轴映射到人类脑电

在包含123名受试者的公开EEG数据集上（受试者观看情感视频片段），研究者发现仅用一个线性投影就能从EEG特征中追踪到每个视频片段的V轴位置。更关键的是，36个独立训练的EEG情绪分类器（未接触V轴信息）在其内部表征中自发地“重新发现”了相同的方向。这表明，无论是语言模型还是人类大脑的电生理活动，都共享一种类似的效价结构。

饱和规律：对齐信号为何失效？

既然LLM与大脑在情绪表征上如此一致，能否利用这种对齐来训练更好的脑机接口（BCI）解码器？研究者测试了25种对齐策略，包括知识蒸馏、表征相似性、对比学习和拓扑损失等。结果令人震惊：没有一种方法能提升解码准确率，其中16种甚至显著降低了性能。

他们用“饱和规律”解释这一现象：当任务标签（如情绪类别）已经足够驱动脑解码网络朝向目标方向时，额外的对齐信号主要干扰一个已经“饱和”的优化盆地，而对承载分类性能的“类内残差”几乎没有贡献。换句话说，LLM-EEG的对齐在宏观方向上成立，但精细分类所需的细节信息并不在此对齐轴上。

突破方向：残差集成

基于这一洞察，研究者提出改进不应来自强化对齐，而应利用监督信号无法触及的残差子空间。他们通过集成多个具有不同残差特征的解码器，在FACED数据集上将平衡准确率提升了10.5%，并在SEED-V上复现了相同效果。

启示与展望

这项研究不仅揭示了LLM与人类大脑在情感处理上的深层联系，也指出了当前脑解码范式的潜在瓶颈。未来，如何有效利用大模型提供的“全局对齐”与“局部残差”之间的互补信息，或将成为提升BCI性能的关键。

现代大语言模型与人类脑电共享一条情绪效价轴：饱和规律揭示