SheepNav
精选今天0 投票

Grokers:在类型化知识图谱上实现自下而上的归纳理解与写入时智能

颠覆RAG范式:Grokers如何将AI理解成本从查询时转移到写入时

传统检索增强生成(RAG)系统在每次查询时都需要调用大语言模型(LLM)来理解上下文,成本高昂且难以复用。而一篇新论文提出的 Grokers 架构,通过将智能从查询时转移到写入时,有望彻底改变这一局面。

核心思想:写入时智能

Grokers 的核心是一种自下而上的归纳遍历架构,专门用于构建类型化知识图谱的持久、结构化理解。与 RAG 在每次查询时支付完整的理解成本不同,Grokers 在数据写入时(即数据进入图谱时)就完成分析。具体来说,自主的 Groker 代理 会分析类型化流图中的节点,通过受控的 LLM 调用提取结构化属性,然后沿依赖关系自下而上地归纳组合这些理解,最终将丰富的类型化属性写回图谱。此后所有查询都能零额外 LLM 成本地使用这些预计算的理解。

三个形式化定理支撑

论文提出了三个关键定理来保证 Grokers 的有效性:

  1. 字节同一性定理:通过事务性维护的反规范化索引,在语义未发生变化时,LLM 上下文块在不同轮次间是字节相同的,这使得 KV 缓存命中率接近 100%,大幅降低推理延迟。

  2. 累积单调性定理:在受控知识库增长协议下,无需 LLM 调用即可解决交互的比例随着交互次数的增加而单调不减,意味着系统越用越“聪明”,LLM 调用越来越少。

  3. 双遍历序定理:明确指出了在依赖有向无环图上,自上而下生成和自下而上理解是各自任务唯一正确的遍历顺序,且两者组合可形成一个完整的生成-理解循环。

确定性搜索替代嵌入

Grokers 还提出了一种基于同义词缓存协议的确定性替代方案,替代传统的嵌入向量语义搜索。对于有限词汇域,其 LLM 回退率可收敛到零,这意味着在特定领域应用中,系统可以完全摆脱对 LLM 实时推理的依赖。

实用价值与开源实现

论文作者 Gregory Magarshak 已在开源项目 Qbix / Safebox / Safebots 中提供了参考实现。该架构特别适合需要频繁查询但数据变更不频繁的知识密集型场景,如企业知识库、法律文档分析、医疗记录推理等。通过将理解成本前置,Grokers 有望将大规模知识图谱的推理成本降低几个数量级。

行业意义

Grokers 的出现挑战了当前 RAG 系统“每次查询都重新理解”的固有思路。如果其理论在实践中得到验证,可能会推动 AI 系统从“每次从头思考”转向“一次理解,多次复用”的新范式,尤其对实时性要求高、推理成本敏感的应用具有重大价值。

延伸阅读

  1. 通用量子Transformer:用5个量子比特实现精确数学推理,超越经典神经网络
  2. 延迟逐步奖励归因:In2AI 用 8B 开源模型在 MindGames Arena 击败 GPT-5 夺冠
  3. 最优传输理论助力贝叶斯优化:海上风电场布局设计效率翻倍
查看原文