分层多 persona 诱导：从行为日志学习有证据的用户画像

用户行为日志蕴含丰富的建模信号，但通常充满噪声且意图交织。现有方法虽能借助大语言模型生成可解释的自然语言 persona，却往往侧重下游任务效用，对 persona 本身质量的评估不足。针对这一问题，arXiv 上最新发表的论文《Hierarchical Multi-Persona Induction from User Behavioral Logs》提出了一种分层框架，通过聚合用户行为形成意图记忆，再经聚类和标注诱导出多个有证据支撑的 persona。研究者将 persona 诱导形式化为一个优化问题，目标函数涵盖聚类紧密度、persona-证据对齐度和 persona 真实性，并采用群体扩展的直接偏好优化（DPO） 来训练模型。在大规模服务日志和两个公开数据集上的实验表明，该方法生成的 persona 更加连贯、有据可查且值得信赖，同时还能提升对未来交互的预测性能。这一工作为构建更可靠、可解释的用户模型提供了新思路。

从用户行为日志中分层诱导多 persona：学习有证据支撑且真实可信的用户画像

延伸阅读

相关资讯