[市场·2026-05-13] Paper Layer

← 返回主报告:[市场·2026-05-13] Politics

Paper Layer — 2026-05-13

今日 134 条候选,paper-digest Top 8 集中在 agent / reasoning / inference 三高热关键词。世界模型主题在 #1(Abbeel + Malik 综述)与 #5(企业上下文反例)同日并发,构成「是否仍需学习动态」的二阶质疑;HF trending #2 / #3 各有一篇入选;KV-cache 长上下文与多智能体测试时演化各占一席,对应推理侧与 Agent 系统侧两条市场可投资主线。

Top picks from paper-digest

  • 2605.00080 World Model for Robot Learning: A Comprehensive Survey — 系统综述机器人学习中的世界模型范式与挑战。 | why for market: Abbeel + Malik 联署的方法论级综述,奠定具身智能 / 机器人学习赛道叙事框架,是 VLA 与机器人初创估值锚点。
  • 2605.08626 Large Language Models over Networks: Collaborative Intelligence under Resource Constraints — 资源受限网络下 LLM 端-边-云协同推理。 | why for market: 端-边-云分层推理直接对应边缘 AI 芯片与电信运营商 AI 战略,HF trending #12。
  • 2605.07153 Beyond Reasoning: Reinforcement Learning Unlocks Parametric Knowledge in LLMs — RL 是激活而非新增 LLM 参数知识的工具。 | why for market: HF trending #3 重定位 RL 角色,若结论成立则削弱 post-training RL 扩张叙事,影响 RLHF / RFT 供应商估值逻辑。
  • 2605.12456 TextSeal: A Localized LLM Watermark for Provenance & Distillation Protection — Gumbel-max 双密钥水印零开销兼容投机解码。 | why for market: 主张 strict-dominate Google SynthID-text,模型版权与蒸馏防护工具,对闭源大厂模型保护策略有连带影响。
  • 2605.12178 Do Enterprise Systems Need Learned World Models? The Importance of Context to Infer Dynamics — 企业系统可读规则即推断动态,未必需世界模型。 | why for market: 当日 HF upvotes 最高(39),与 #1 综述构成对立叙事,企业 AI 实施侧倾向轻量上下文方案,影响 enterprise agent 平台选型。
  • 2605.11400 UniPath: Adaptive Coordination of Understanding and Generation for Unified Multimodal Reasoning — 多模态推理理解与生成的自适应路径协调。 | why for market: HF trending #2,统一多模态推理时协调路径,对标 GPT-4o / Gemini 多模态统一架构演进。
  • 2605.09539 TacoMAS: Test-Time Co-Evolution of Topology and Capability in LLM-based Multi-Agent Systems — 测试时联合演化拓扑与能力的多智能体框架。 | why for market: HF trending #9,多智能体编排框架商业化新范式,影响 AutoGen / CrewAI / LangGraph 等 multi-agent 平台竞争。
  • 2605.12471 KV-Fold: One-Step KV-Cache Recurrence for Long-Context Inference — KV-cache 一步左折叠免训练长上下文推理。 | why for market: 函数式 foldl 视角免训练长上下文推理,对应推理基础设施成本下降,利好 vLLM / SGLang 生态。

Technical signals (non-paper-digest)

  • 系统加速侧 Tri Dao 团队发布 BFP 量化 scale 搜索(2605.12464),延续其 FlashAttention / Mamba 等工程影响力,预期被 vLLM / TensorRT-LLM 等推理栈快速吸收(arxiv)。
  • 商汤 SenseNova-U1 提出 NEO-unify 架构统一多模态理解与生成(2605.12500),与 #6 UniPath 形成「单一架构 vs 自适应协调」两条工业路线分叉,国内大模型厂商多模态路线选型信号(arxiv)。