2026-04-22 论文速递

对 agent / LLM / AI 基础设施方向共 10 篇 arXiv 论文的自动摘要,由 Claude Code 生成分析。

1. SAKE: Self-aware Knowledge Exploitation-Exploration for Grounded Multimodal Named Entity Recognition

arXiv: 2604.20146 · cs.IR · 相关度分数 32

SAKE 是一个端到端 agentic 框架,通过自我感知推理与自适应检索工具调用,在 Grounded Multimodal NER 任务上协调 MLLM 的内部知识利用与外部知识探索。

阅读完整分析 →


2. HaS: Accelerating RAG through Homology-Aware Speculative Retrieval

arXiv: 2604.20452 · cs.IR · 相关度分数 26

HaS 提出一种同源感知的推测式检索框架,通过小范围推测 + 同源查询再识别验证,在几乎不损精度的前提下显著加速 RAG 检索。

阅读完整分析 →


3. Automatic Ontology Construction Using LLMs as an External Layer of Memory, Verification, and Planning for Hybrid Intelligent Systems

arXiv: 2604.20795 · cs.AI · 相关度分数 22

论文提出一种混合架构,用自动构建的 RDF/OWL 本体作为 LLM 的外部记忆层,结合 RAG 与图推理,提升多步规划的可验证性与可靠性。

阅读完整分析 →


4. Breaking MCP with Function Hijacking Attacks: Novel Threats for Function Calling and Agentic Models

arXiv: 2604.20994 · cs.CR · 相关度分数 21

提出 Function Hijacking Attack (FHA),通过操纵 agentic LLM 的工具选择过程,强制调用攻击者指定的函数,在 BFCL 上对 5 个模型实现 70%–100% 攻击成功率。

阅读完整分析 →


5. Cooperative Profiles Predict Multi-Agent LLM Team Performance in AI for Science Workflows

arXiv: 2604.20658 · cs.CL · 相关度分数 21

用行为经济学博弈测出的"合作画像"能稳健预测 LLM 多智能体团队在 AI-for-Science 协作任务中的表现,可作为部署前的廉价筛选工具。

阅读完整分析 →


6. FASER: Fine-Grained Phase Management for Speculative Decoding in Dynamic LLM Serving

arXiv: 2604.20503 · cs.DC · 相关度分数 21

FASER 通过细粒度的推测解码阶段管理(动态投机长度、早剪枝、draft/verify 重叠),在 vLLM 中实现最高 53% 吞吐提升与 1.92× 延迟降低。

阅读完整分析 →


7. Dual-Cluster Memory Agent: Resolving Multi-Paradigm Ambiguity in Optimization Problem Solving

arXiv: 2604.20183 · cs.CL · 相关度分数 20

DCM-Agent 通过构建建模/编码双簇记忆并提炼 Approach、Checklist、Pitfall 三类结构化知识,在免训练条件下缓解优化问题求解中的多范式歧义,七项基准平均提升 11%–21%。

阅读完整分析 →


8. EvoAgent: An Evolvable Agent Framework with Skill Learning and Multi-Agent Delegation

arXiv: 2604.20133 · cs.AI · 相关度分数 19

EvoAgent 提出可进化的 LLM agent 框架,通过结构化技能学习与分层子 agent 委派,使 GPT5.2 在外贸场景综合评分提升约 28%。

阅读完整分析 →


9. Agentic AI for Personalized Physiotherapy: A Multi-Agent Framework for Generative Video Training and Real-Time Pose Correction

arXiv: 2604.21154 · cs.AI · 相关度分数 19

提出一个多智能体框架,用生成式视频和实时姿态估计为居家物理治疗提供个性化训练与反馈。

阅读完整分析 →


10. Co-Evolving LLM Decision and Skill Bank Agents for Long-Horizon Tasks

arXiv: 2604.20987 · cs.AI · 相关度分数 19

COSPLAY 提出 LLM 决策 agent 与可学习 skill bank 协同演化的框架,在长时序游戏任务中让 8B 模型显著超越前沿 LLM baseline。

阅读完整分析 →