← 返回主报告：[市场·2026-05-15] Politics

Paper Layer — 2026-05-15

paper-digest status: consumed（/home/.oh-my-agent/reports/paper-digest/daily/2026-05-15.json）

来自 paper-digest 的本日五条

2605.15178 SANA-WM: Efficient Minute-Scale World Modeling with Hybrid Linear Diffusion Transformer — 2.6B 混合线性注意力分钟级 720p 世界模型；开源阵营对 Veo / Sora 的最新追赶，把 world-model 推理成本推到消费级显存可承担区间。
2605.06527 STALE: Can LLM Agents Know When Their Memories Are No Longer Valid? — 三维探针（State Resolution / Premise Resistance / Implicit Policy Adaptation）测 LLM 记忆陈旧化与隐式更新；正面回应 Mythos / Codex / Grok Build 长程 agent 的 stale state 盲点。
2605.08703 RewardHarness: Self-Evolving Agentic Post-Training — 上下文演化替代微调的自演化奖励框架；把 reward model 从权重侧搬到上下文，对应 post-training 数据效率瓶颈。
2605.14438 BEAM: Binary Expert Activation Masking for Dynamic Routing in MoE — 可训练二值掩码实现 MoE token 自适应路由；无需重训降低推理成本，命中 Mistral Medium / DeepSeek V4 / Qwen3.6 共同 MoE 底座。
2605.15051 An Interpretable Latency Model for Speculative Decoding in LLM Serving — 面向生产 SD 服务的可解释推理延迟模型；与 Hut 8 $9.8B DSX、Huawei Atlas 950 等基础设施投入形成 software-side 配对。

OpenAI Codex on Windows 沙箱方案落地 — 本地双账户隔离（CodexSandboxOffline / CodexSandboxOnline）+ OS 级出站封禁 + 工作区写入边界，把 agent 安全沙箱工程化下沉到 Windows 平台。来源：OpenAI Index, WinBuzzer.
xAI Grok Build CLI 公测扩大 — 5/14 Musk 个人扩大公测邀请，agentic coding CLI 第四家入场（与 Claude Code / Codex CLI / Mistral Vibe 同类）；仍属 early beta + 反馈征集阶段，尚未 GA。来源：Basenor 综合.

paper-digest 2026-05-15.json 的 arxiv_id 形如 2605.xxxxx 与正式 arXiv 编号规则不完全匹配，本报告按 paper-digest 字段原样透传，arxiv_url 以 paper-digest 提供为准。