arXiv: 2604.22085 · PDF

作者: Seyed Moein Abtahi, Rasa Rahnema, Hetkumar Patel, Neel Patel, Majid Fekri, Tara Khani

单位: Moorcheh AI, EdgeAI Innovations

主分类: cs.AI · 全部: cs.AI

命中关键词: large language model, agent, agentic, retrieval, inference, latency


TL;DR

Memanto 用类型化语义记忆 schema + Moorcheh 信息论检索引擎替代混合知识图谱,在 LongMemEval 和 LoCoMo 上分别达到 89.8% 和 87.1% 的 SOTA,单次检索、零 ingestion 延迟。

核心观点

  • 挑战"高保真 agent 记忆必须依赖知识图谱复杂度"的主流假设。
  • 提出通用记忆层 Memanto:typed semantic memory schema + 自动冲突消解 + 时间版本控制。
  • 用 Moorcheh 的 Information-Theoretic Search(无索引语义数据库)实现 sub-90ms 确定性检索、无 ingestion 延迟。
  • 仅需单次检索 query,运营复杂度远低于 hybrid graph / vector 系统。

方法

  • 定义 13 个预设记忆类别的 typed semantic memory schema,对写入记忆做类型化组织。
  • 自动冲突消解机制 + temporal versioning,处理多 session 长时记忆一致性。
  • 检索层用 Moorcheh 信息论搜索引擎:no-indexing、确定性检索,消除 ingestion 阶段延迟。
  • 摒弃 LLM-mediated entity extraction、显式 graph schema 维护和多 query 检索管线。

实验

  • 基准:LongMemEval、LoCoMo 两个长时记忆评测套件。
  • 基线:已评估的 hybrid graph 系统与 vector-based 系统(摘要未具名)。
  • 消融:五阶段渐进式 ablation,量化各组件贡献。
  • 指标:准确率、检索延迟、ingestion 成本、检索 query 次数。

结果

  • LongMemEval 89.8%,LoCoMo 87.1%,均超过所有已评估基线,达到 SOTA。
  • 检索延迟 <90ms,ingestion 延迟为 0,单次检索 query 即可命中。
  • 五阶段 ablation 证实 typed schema、冲突消解、Moorcheh 引擎各自的增益。

为什么重要

为生产级长时 agent 提供一条绕开知识图谱重工程的可行路径:低延迟、低运营成本、可扩展,直接缓解多 session agent 的记忆瓶颈。

与已有工作的关系

对标 hybrid semantic graph 记忆系统(如 knowledge-graph-based agent memory)与纯 vector RAG 方案;延续 LongMemEval、LoCoMo 的长时记忆评测脉络;检索层替换为 Moorcheh 信息论搜索。

尚未回答的问题

  • 13 类 schema 的覆盖度与跨领域泛化?
  • 冲突消解在对抗/噪声输入下的鲁棒性?
  • Moorcheh 引擎在超大规模记忆库上的扩展极限与成本曲线?
  • 与最新 graph-based 方法的公平对比细节。

原始摘要(中文翻译)

从无状态的语言模型推理向持久化、多会话自主 agent 的转变,揭示了记忆是生产级 agentic 系统部署中的主要架构瓶颈。现有方法大多依赖混合语义图架构,这在 ingestion 和检索两个阶段都带来了显著的计算开销。这些系统通常需要由大语言模型中介的实体抽取、显式的图 schema 维护,以及多 query 的检索管线。本文提出 Memanto,一种面向 agentic 人工智能的通用记忆层,挑战了"必须依赖知识图谱复杂度才能实现高保真 agent 记忆"这一主流假设。Memanto 集成了一个包含十三个预定义记忆类别的 typed semantic memory schema、一套自动冲突消解机制,以及时间版本控制。这些组件由 Moorcheh 的 Information-Theoretic Search 引擎驱动,该引擎是一个无索引的语义数据库,可在 sub-ninety-millisecond 延迟内提供确定性检索,同时消除 ingestion 延迟。通过在 LongMemEval 和 LoCoMo 评测套件上的系统性基准测试,Memanto 分别取得了 89.8% 和 87.1% 的 state-of-the-art 准确率。这些结果超过了所有被评估的 hybrid graph 和 vector-based 系统,同时只需单次检索 query,没有 ingestion 成本,并且保持显著更低的运营复杂度。本文还给出了一项五阶段渐进式消融研究,以量化各架构组件的贡献,随后讨论了对可扩展部署 agentic 记忆系统的影响。