[论文·2026-05-22]

论文雷达日报|2026-05-22

一句话结论:今日论文层是一轮以 KV cache 为焦点的『注意力/推理效率』微周期,并行叠加 agentic reasoning(临床寻证 + 形式化证明);最强观察是 KV 被同时从压缩、安全共享、稀疏化三路攻坚。

摘要

  • 今日 140 篇候选全部为新面孔(无一落入过去 14 天 seen-pool,seen_count=231),主线集中在注意力 / 推理效率:HF 头部 Full Attention Strikes Back(百步把全注意力迁成稀疏)领跑,叠加 Gated DeltaNet-2(线性注意力)、WorldKV、KVServe、Q-ARVD(视频扩散量化)共同构成一轮 inference-efficiency 微周期。第二主轴是 agentic reasoning:ClinSeekAgent(临床主动寻证)、Lean Refactor 与 DeepMind 的形式化证明搜索、LCGuard(多智能体 KV 安全)交叉命中 reasoning+agent。最强单点观察:KV cache 同时从压缩(WorldKV/KVServe)、安全共享(LCGuard)、稀疏化(Full Attention)三个角度被攻,说明 KV 已成为本轮系统层争夺焦点。S2 metadata 稀疏(6/140 有 tldr、0 篇返回相似图谱),故延伸阅读段空缺。
  • 候选规模 140 篇(arXiv primary + HF curated + S2 metadata),seen-pool 去重后 0 篇重复,全部为今日新批次。
  • 效率主线:Full Attention Strikes Back / Gated DeltaNet-2 / Q-ARVD / WorldKV / KVServe;agentic 主线:ClinSeekAgent / Lean Refactor / Formal Proof Search / LCGuard。

📌 Top picks (交叉命中)

Full Attention Strikes Back: Transferring Full Attention into Sparse within Hundred Training Steps(HF#16 · 69赞 · score 7.9) → 百步训练把全注意力迁移成稀疏,破解长上下文推理瓶颈

  • 入选:HF trending #16(69 赞) + watchlist 命中 reasoning/inference/kv cache;本日 attention 效率主线最高分候选
  • 作者:Yanke Zhou, Yiduo Li, Hanlin Tang, Maohua Li, Kan Liu, Lan Tao 等
  • 证据:arXiv HF

Q-ARVD: Quantizing Autoregressive Video Diffusion Models(HF#17 · 14赞 · score 7.3) → 量化自回归视频扩散模型,降低实时流式生成推理成本

  • 入选:HF trending #17 + watchlist 命中 quantization/inference/world model;把量化推向视频扩散世界模型
  • 作者:Siao Tang, Xinyin Ma, Gongfan Fang, Xingyi Yang, Xinchao Wang
  • 证据:arXiv HF

ClinSeekAgent: Automating Multimodal Evidence Seeking for Agentic Clinical Reasoning(HF#18 · 4赞 · score 7.2) → 临床推理智能体,主动检索并综合多模态证据

  • 入选:HF trending #18 + watchlist 命中 reasoning/agent/inference;不再假设证据已策展,强调主动寻证
  • 作者:Juncheng Wu, Letian Zhang, Yuhan Wang, Haoqin Tu, Hardy Chen, Zijun Wang 等
  • 证据:arXiv HF

LCGuard: Latent Communication Guard for Safe KV Sharing in Multi-Agent Systems(score 7.0 · cs.AI/cs.ET/cs.LG/cs.MA) → 守护多智能体潜空间通信,安全共享KV缓存

  • 入选:watchlist 命中 reasoning/agent/kv cache + benchmark;cs.MA 交叉,KV 共享安全是多智能体新攻面
  • 作者:Sadia Asif, Mohammad Mohammadi Amiri, Momin Abbas, Prasanna Sattigeri, Karthikeyan Natesan Ramamurthy
  • 证据:arXiv HF

ACC: Compiling Agent Trajectories for Long-Context Training(HF#41 · 51赞 · score 5.5) → 把智能体轨迹编译成长上下文训练数据,省去人工策展

  • 入选:watchlist 命中 reasoning/agent + sft;HF #41(51 赞),用 agent 轨迹替代昂贵长文档策展
  • 作者:Qisheng Su, Zhen Fang, Shiting Huang, Yu Zeng, Yiming Zhao, Kou Shi 等
  • 证据:arXiv HF

Lean Refactor: Multi-Objective Controllable Proof Optimization via Agentic Strategy Search(HF#8 · 1赞 · score 5.2) → 检索增强智能体,多目标可控重构Lean证明

  • 入选:HF trending #8 + watchlist 命中 agent;针对 LLM 形式化证明冗长脆弱的 agentic 优化
  • 作者:Jialin Lu, Soonho Kong, Rodrigo Stehling, Kaiyu Yang, Zhangyang Wang, Weiran Sun 等
  • 证据:arXiv HF

Perception or Prejudice: Can MLLMs Go Beyond First Impressions of Personality?(HF#29 · 88赞 · score 5.1) → 评测MLLM能否超越对人格的第一印象偏见

  • 入选:HF trending #29(88 赞) + watchlist 命中 reasoning/agent + benchmark;从分数预测转向行为感知评测
  • 作者:Caixin Kang, Tianyu Yan, Sitong Gong, Mingfang Zhang, Liangyang Ouyang, Ruicong Liu 等
  • 证据:arXiv HF

Maestro: Reinforcement Learning to Orchestrate Hierarchical Model-Skill Ensembles(HF#28 · 17赞 · score 4.7) → 用强化学习编排分层模型-技能集成

  • 入选:HF trending #28 + watchlist 命中 reasoning/agent + benchmark;打破单体 LLM 接口技能的瓶颈
  • 作者:Jinyang Wu, Guocheng Zhai, Ruihan Jin, Yuhao Shen, Zhengxi Lu, Fan Zhang 等
  • 证据:arXiv HF

🏷 Watchlist 分类命中

本次 raw fresh、关键词命中但未进 Top picks 的论文,按 arXiv category 分组。

cs.AI

cs.CL

cs.CV

cs.RO

cs.LG

🔗 延伸阅读 (Semantic Scholar 相似论文)

本段今日无高置信度增量信号(S2 相似论文未返回)。140 篇候选中仅 6 篇带 S2 tldr,且全部未返回 similar_papers 引用图谱,故 extended_reading=[],对应 coverage_gaps: s2_similar_unavailable

🧑‍🔬 新出现的作者 / 团队

  • Pushmeet Kohli(Google DeepMind,frontier-labs,cross_checked=false):领衔 DeepMind 形式化证明搜索新作(Advancing Mathematics Research with AI-Driven Formal Proof Search),首次大规模评测 LLM 用 Lean 解决研究级数学;合著含 Thomas Hubert / Matej Balog / Aja Huang 等 AlphaProof 谱系作者。机构归属系作者签名公开背景推断,本轮未交叉核验。
  • Jan Kautz(NVIDIA,frontier-labs,cross_checked=false):NVIDIA 团队线性注意力新架构 Gated DeltaNet-2,解耦擦除与写入以更稳地编辑压缩记忆;合著含 Ali Hatamizadeh / Yejin Choi。机构归属系作者签名公开背景推断,本轮未交叉核验。

📉 覆盖缺口与不确定性

  • s2_similar_unavailable
  • affiliations_unavailable
  • s2_metadata_sparse: 仅 6/140 候选返回 S2 tldr/链接,0 篇返回相似图谱(相似论文段缺失)
  • affiliations_inferred: 候选 JSON 无机构字段,DeepMind / NVIDIA 归属系作者签名推断,cross_checked=false 未本轮核验
  • categories_partial: 100/140 候选带 arXiv 分类,约 40 篇(多为 HF 源)分类缺失

来源与交叉验证说明

结论锚 arXiv primary;HF Daily 作 trending 热度信号(49/140 带 upvotes),不作论文结果证据;Semantic Scholar metadata 稀疏(6/140 有 tldr,全部无相似图谱),仅作补充。paper_fetch stderr 为空,无单源完全降级。

三源均返回(paper_fetch.err 空)。140 篇候选全部不在 14 天 seen-pool,今日为全新批次,无需向延伸阅读降级。结论锚 arXiv primary,HF trending 仅作热度信号;S2 因新预印本索引滞后未提供相似图谱,延伸阅读段按规约留空。