SheepNav
精选1个月前0 投票

从用户行为日志中分层诱导多 persona:学习有证据支撑且真实可信的用户画像

用户行为日志蕴含丰富的建模信号,但通常充满噪声且意图交织。现有方法虽能借助大语言模型生成可解释的自然语言 persona,却往往侧重下游任务效用,对 persona 本身质量的评估不足。针对这一问题,arXiv 上最新发表的论文《Hierarchical Multi-Persona Induction from User Behavioral Logs》提出了一种分层框架,通过聚合用户行为形成意图记忆,再经聚类和标注诱导出多个有证据支撑的 persona。研究者将 persona 诱导形式化为一个优化问题,目标函数涵盖聚类紧密度、persona-证据对齐度和 persona 真实性,并采用群体扩展的直接偏好优化(DPO) 来训练模型。在大规模服务日志和两个公开数据集上的实验表明,该方法生成的 persona 更加连贯、有据可查且值得信赖,同时还能提升对未来交互的预测性能。这一工作为构建更可靠、可解释的用户模型提供了新思路。

延伸阅读

  1. EHRBench:基于电子健康记录的大模型临床决策能力自动化评估基准
  2. 结构诱导信息助力重根列文树搜索:隐式子任务分解的新范式
  3. 不确定性感知与时间调控的专家建议:让自动驾驶强化学习更安全
查看原文