Memanto: Typed Semantic Memory with Information-Theoretic Retrieval for Long-Horizon Agents

arXiv: 2604.22085 · PDF

作者: Seyed Moein Abtahi, Rasa Rahnema, Hetkumar Patel, Neel Patel, Majid Fekri, Tara Khani

单位: Moorcheh AI, EdgeAI Innovations

主分类: cs.AI · 全部: cs.AI

命中关键词: large language model, agent, agentic, retrieval, inference, latency

TL;DR

Memanto 用类型化语义记忆 schema + Moorcheh 信息论检索引擎替代混合知识图谱，在 LongMemEval 和 LoCoMo 上分别达到 89.8% 和 87.1% 的 SOTA，单次检索、零 ingestion 延迟。

核心观点

挑战"高保真 agent 记忆必须依赖知识图谱复杂度"的主流假设。
提出通用记忆层 Memanto：typed semantic memory schema + 自动冲突消解 + 时间版本控制。
用 Moorcheh 的 Information-Theoretic Search（无索引语义数据库）实现 sub-90ms 确定性检索、无 ingestion 延迟。
仅需单次检索 query，运营复杂度远低于 hybrid graph / vector 系统。

方法

定义 13 个预设记忆类别的 typed semantic memory schema，对写入记忆做类型化组织。
自动冲突消解机制 + temporal versioning，处理多 session 长时记忆一致性。
检索层用 Moorcheh 信息论搜索引擎：no-indexing、确定性检索，消除 ingestion 阶段延迟。
摒弃 LLM-mediated entity extraction、显式 graph schema 维护和多 query 检索管线。

实验

基准：LongMemEval、LoCoMo 两个长时记忆评测套件。
基线：已评估的 hybrid graph 系统与 vector-based 系统（摘要未具名）。
消融：五阶段渐进式 ablation，量化各组件贡献。
指标：准确率、检索延迟、ingestion 成本、检索 query 次数。

结果

LongMemEval 89.8%，LoCoMo 87.1%，均超过所有已评估基线，达到 SOTA。
检索延迟 <90ms，ingestion 延迟为 0，单次检索 query 即可命中。
五阶段 ablation 证实 typed schema、冲突消解、Moorcheh 引擎各自的增益。

为什么重要

为生产级长时 agent 提供一条绕开知识图谱重工程的可行路径：低延迟、低运营成本、可扩展，直接缓解多 session agent 的记忆瓶颈。

与已有工作的关系

对标 hybrid semantic graph 记忆系统（如 knowledge-graph-based agent memory）与纯 vector RAG 方案；延续 LongMemEval、LoCoMo 的长时记忆评测脉络；检索层替换为 Moorcheh 信息论搜索。

尚未回答的问题

13 类 schema 的覆盖度与跨领域泛化？
冲突消解在对抗/噪声输入下的鲁棒性？
Moorcheh 引擎在超大规模记忆库上的扩展极限与成本曲线？
与最新 graph-based 方法的公平对比细节。

原始摘要（中文翻译）

从无状态的语言模型推理向持久化、多会话自主 agent 的转变，揭示了记忆是生产级 agentic 系统部署中的主要架构瓶颈。现有方法大多依赖混合语义图架构，这在 ingestion 和检索两个阶段都带来了显著的计算开销。这些系统通常需要由大语言模型中介的实体抽取、显式的图 schema 维护，以及多 query 的检索管线。本文提出 Memanto，一种面向 agentic 人工智能的通用记忆层，挑战了"必须依赖知识图谱复杂度才能实现高保真 agent 记忆"这一主流假设。Memanto 集成了一个包含十三个预定义记忆类别的 typed semantic memory schema、一套自动冲突消解机制，以及时间版本控制。这些组件由 Moorcheh 的 Information-Theoretic Search 引擎驱动，该引擎是一个无索引的语义数据库，可在 sub-ninety-millisecond 延迟内提供确定性检索，同时消除 ingestion 延迟。通过在 LongMemEval 和 LoCoMo 评测套件上的系统性基准测试，Memanto 分别取得了 89.8% 和 87.1% 的 state-of-the-art 准确率。这些结果超过了所有被评估的 hybrid graph 和 vector-based 系统，同时只需单次检索 query，没有 ingestion 成本，并且保持显著更低的运营复杂度。本文还给出了一项五阶段渐进式消融研究，以量化各架构组件的贡献，随后讨论了对可扩展部署 agentic 记忆系统的影响。