[市场·2026-05-21] Paper Layer

← 返回主报告:[市场·2026-05-21] Politics

Paper Layer | AI Daily | 2026-05-21

Source

  • paper-digest daily JSON: /home/.oh-my-agent/reports/paper-digest/daily/2026-05-21.json(status: consumed
  • 共消费 8 篇 Top picks(来自 HuggingFace Daily + 关键词命中 + watchlist 共振)

Top picks(直接来自 paper-digest,不重抓 arXiv)

  • 2605.20682 IndusAgent: Reinforcing Open-Vocabulary Industrial Anomaly Detection with Agentic Tools — 工具增强智能体提升开放词汇工业异常检测;agentic 工具使用落到工业垂直,与今日 Mistral Workflows 等 application 层 agent 部署互补。
  • 2605.20315 Mix-Quant: Quantized Prefilling, Precise Decoding for Agentic LLMs — 面向智能体 LLM 的相位感知量化加速预填充;agentic 长上下文 prefill 占成本主导,分相位量化直接影响推理经济学,与 Nvidia Rubin/Vera 推理成本叙事互补。
  • 2605.21226 OCTOPUS: Optimized KV Cache for Transformers via Octahedral Parametrization — 三元组联合旋转实现极致 KV 缓存量化;与 OScaR 同日同主题,KV 量化第三波密集论文,推理成本曲线压缩节奏明显。
  • 2605.20834 Conditional Equivalence of DPO and RLHF — DPO 与 RLHF 仅在隐含假设下条件等价;理论 nail 失败条件,影响 alignment 配方选择。
  • 2605.21266 How Much Online RL is Enough? Informative Rollouts for Offline Preference Optimization in RLVR — RLVR 离线化降本路线,是 frontier lab post-train 成本结构的关键变量。
  • 2605.19660 OScaR: The Occam’s Razor for Extreme KV Cache Quantization — per-channel 路线,与 OCTOPUS 对照阅读;KV 量化方法快速收敛。
  • 2602.07892 Safety Alignment as Continual Learning: Mitigating the Alignment Tax via Orthogonal Gradient Projection — 正交梯度投影缓解 alignment tax,HF + S2 双源覆盖。
  • 2605.19376 Generative Recursive Reasoning — Bengio 共著,把潜状态推为概率轨迹的 reasoning 路线。

技术信号(paper-digest 不覆盖范围)

  • Anthropic Managed Agents 5/19 上线 MCP tunnels + self-hosted sandboxes:MCP 协议从客户端工具扩展为 enterprise 部署形态——私网 MCP 服务器通过 Anthropic 反向隧道暴露给 agent,客户自管沙箱保留敏感数据不离场(9to5Mac)。
  • Mistral 5/20 发布企业 Workflows 平台(Temporal-powered):欧洲 frontier lab 第一家把开权重模型栈与生产级 orchestration 框架(幂等、step-by-step 审计、超时处理)直连,从 PoC 推向 production-grade(The New York ReportInfoQ)。
  • Google I/O 2026 5/19 Gemini 3.5 Flash 正式发布:coding / agentic / multimodal 基准超 3.1 Pro,输出 token/s 4× 同类 frontier;定价 + 速度曲线再下拉一档(Android AuthorityGoogle Blog)。

Coverage notes

  • paper_digest_status = consumed,无 gap。
  • confidence_flags:paper_digest_arxiv_id_format_pass_through(arxiv_id 形如 2605.xxxxx 来自源 JSON 原样透传,未额外校验)。