SheepNav
精选18天前0 投票

CHAL:分层智能体语言议会——将多智能体辩论重塑为信念优化引擎

多智能体辩论被寄望于提升大语言模型(LLM)的推理能力,但现有方法存在结构性局限:辩论倾向于在信念轨迹上形成鞅过程,多数投票贡献了大部分性能增益,且LLM在轮次中表现出信心膨胀而非校准。最新研究《CHAL: Council of Hierarchical Agentic Language》指出,辩论与辩证系统的真正价值不在事实性任务,而在可辩驳领域——即任何立场原则上都可能被更优推理击败。

来自该研究的团队提出了分层智能体语言议会(CHAL),一个将可辩驳论证视为信念优化引擎的多智能体辩证框架。每个智能体维护一个CHAL信念模式(CBS),这是一种受贝叶斯启发的图结构信念表示,通过梯度感知动态机制利用信念论点的强度作为可微目标,促进信念修订。元认知价值系统(涵盖认识论、逻辑与伦理)被提升为可配置的超参数,控制智能体推理与裁决结果。

消融实验显示系统性且可解释的效果:裁决者的价值系统决定潜在信念空间中辩论的整体轨迹;议会的多样性优化所有参与者的信念;该框架在广泛领域具有泛化能力。据作者所知,CHAL是首个将多智能体辩论视为结构化信念优化的框架,其可审计的信念产物为可辩驳论证的专用评估套件奠定基础,对构建推理与价值承诺透明、对齐且受人类监督的AI系统具有深远意义。

延伸阅读

  1. 结构诱导信息助力重根列文树搜索:隐式子任务分解的新范式
  2. EHRBench:基于电子健康记录的大模型临床决策能力自动化评估基准
  3. 不确定性感知与时间调控的专家建议:让自动驾驶强化学习更安全
查看原文