← 返回主报告:[市场·2026-05-15] Politics
Paper Layer — 2026-05-15
paper-digest status: consumed(/home/.oh-my-agent/reports/paper-digest/daily/2026-05-15.json)
来自 paper-digest 的本日五条
- 2605.15178 SANA-WM: Efficient Minute-Scale World Modeling with Hybrid Linear Diffusion Transformer — 2.6B 混合线性注意力分钟级 720p 世界模型;开源阵营对 Veo / Sora 的最新追赶,把 world-model 推理成本推到消费级显存可承担区间。
- 2605.06527 STALE: Can LLM Agents Know When Their Memories Are No Longer Valid? — 三维探针(State Resolution / Premise Resistance / Implicit Policy Adaptation)测 LLM 记忆陈旧化与隐式更新;正面回应 Mythos / Codex / Grok Build 长程 agent 的 stale state 盲点。
- 2605.08703 RewardHarness: Self-Evolving Agentic Post-Training — 上下文演化替代微调的自演化奖励框架;把 reward model 从权重侧搬到上下文,对应 post-training 数据效率瓶颈。
- 2605.14438 BEAM: Binary Expert Activation Masking for Dynamic Routing in MoE — 可训练二值掩码实现 MoE token 自适应路由;无需重训降低推理成本,命中 Mistral Medium / DeepSeek V4 / Qwen3.6 共同 MoE 底座。
- 2605.15051 An Interpretable Latency Model for Speculative Decoding in LLM Serving — 面向生产 SD 服务的可解释推理延迟模型;与 Hut 8 $9.8B DSX、Huawei Atlas 950 等基础设施投入形成 software-side 配对。
paper-digest 未覆盖的技术信号
- OpenAI Codex on Windows 沙箱方案落地 — 本地双账户隔离(
CodexSandboxOffline/CodexSandboxOnline)+ OS 级出站封禁 + 工作区写入边界,把 agent 安全沙箱工程化下沉到 Windows 平台。来源:OpenAI Index, WinBuzzer. - xAI Grok Build CLI 公测扩大 — 5/14 Musk 个人扩大公测邀请,agentic coding CLI 第四家入场(与 Claude Code / Codex CLI / Mistral Vibe 同类);仍属 early beta + 反馈征集阶段,尚未 GA。来源:Basenor 综合.
备注
- paper-digest 2026-05-15.json 的
arxiv_id形如2605.xxxxx与正式 arXiv 编号规则不完全匹配,本报告按 paper-digest 字段原样透传,arxiv_url 以 paper-digest 提供为准。