AI 日报｜2026-05-07

一句话结论：5/6 是当周 frontier-lab 信号最密的一天——Anthropic 在 Code w/ Claude SF 用一场主旨演讲把 Opus 4.7 GA、Code Review、Claude Code Web/Desktop、Routines、Multi-agent / Outcomes / Dreaming 与 SpaceX Colossus 1（300MW+ / 220K NVIDIA GPU）三层一并升级；OpenAI 把 GPT-5.5 Instant 推为 ChatGPT 默认（5/5）+ B2B Signals 企业用量报告（5/6）补齐企业渗透叙事；中国侧 DeepSeek 据 FT/Bloomberg 进入"中国大基金 + Tencent + Alibaba"领投的 $45B 估值首轮谈判，与 Nvidia 中国 0% 市占形成镜像；Meta 5/5 被五家出版巨头集体起诉 Llama 训练版权；Pentagon 5/1 排除 Anthropic 后，Wall Street + Code w/ Claude 双战场是 Anthropic 当周对外定位的彻底重构。

摘要

Frontier 总览：Anthropic 在 5/6 单日完成"模型 + 算力 + 产品"三轴升级；OpenAI 5/5-5/6 默认重置 + 企业画像；DeepSeek 5/6 估值跃升 + 国产芯片 binding；Meta 进入 second-wave 版权诉讼；Google / xAI / Mistral / Qwen 维持存量节奏。
Paper 总览：paper-digest 5/7 命中 8 篇（reasoning + agent 双主线），OpenSearch-VL（多模态 agent + 容错 GRPO）+ First-Token confidence（低成本幻觉检测）+ SWE-WebDevBench（vibe coding agent benchmark）三篇与今日 frontier 发布同向。
People 总览：Simon Willison 现场 live blog Code w/ Claude SF；Boris Cherny 主舞台介绍 Routines；Greg Brockman 庭审第六日二度作证；前 OpenAI CTO Mira Murati 庭上指 Altman “sowed chaos”；候选池新增 Ami Vora / Cat Wu / Mira Murati 三位。
5-Layer 总览：Energy 侧美国数据中心建设 ~50% 推迟 + 天然气放量；Chips 侧 DeepSeek 大基金资本撮合 + Nvidia 中国 0% 市占 + Anthropic 接 Colossus 1；Infra 侧 Memphis 220K GPU + Pentagon 八合同 + AWS Bedrock OpenAI 上架；Model 侧 GPT-5.5 Instant + Opus 4.7 + Mistral Medium 3.5 + Gemini 3.2 Flash leak；Application 侧 B2B Signals + Wall Street 全栈 + EPAM ServiceNow + Claude Code Web。
Cross-layer 总览：Anthropic-SpaceX Colossus 一笔交易在 Infra→Model→Application 三层同时显形；Pentagon 5/1 排除 ↔ Wall Street 5/5 主战场切换 ↔ 5/6 Opus 4.7 GA 完成自我修正；中美 frontier 算力两端通过 Anthropic-SpaceX 与 DeepSeek-中国大基金分别加速。

Frontier Labs / Frontier Model Radar

5/6 是当周前沿信号最密的一天。Anthropic Code w/ Claude SF 一次性升级 Claude Opus 4.7 GA、Code Review、Claude Code Web/Desktop、Routines 与 Managed Agents 三件升级（multi-agent orchestration / Outcomes / Dreaming），并宣布与 SpaceX 接管 Colossus 1（300MW+ / 220K NVIDIA GPU）的算力大单；OpenAI 5/5 把 GPT-5.5 Instant 推为 ChatGPT 默认，5/6 配套发布 B2B Signals 企业用量报告，5/4 把 GPT-5.5 / Codex / Bedrock Managed Agents 上线 AWS Bedrock；DeepSeek 5/6 据 FT/Bloomberg 进入由"中国大基金"领投、Tencent + Alibaba 跟投的 $45B 估值首轮融资谈判；Meta 5/5 被 Elsevier 等五家出版巨头集体起诉 Llama 训练版权；Google Gemini 3.2 Flash 5/5 漏出 iOS App / AI Studio；Mistral / xAI / Qwen 维持 4 月底存量节奏。

OpenAI

GPT-5.5 Instant 5/5 默认化：替换 GPT-5.3 Instant，在医、法、金融高敏感场景内部评测幻觉率下降 52.5%，旧用户标记错误对话再降 37.3%；Plus / Pro 用户开启跨历史对话 + 上传文件 + Gmail 的"记忆源"上下文（TechCrunch / OpenAI）。
B2B Signals 5/6 发布：95 分位 frontier 企业 intelligence 用量是普通企业的 3.5 倍（一年前 2 倍），Codex agentic 用量差距 16 倍；message volume 仅解释 36% 差距，其余来自"深度 + 委托"工作流（OpenAI）。
OpenAI 模型登陆 AWS Bedrock（5/4）：GPT-5.5 / GPT-5.4 + Codex on AWS + Bedrock Managed Agents Powered by OpenAI（AWS Blog）。
Musk vs OpenAI Day 6（5/6）：Greg Brockman 二度作证；前 CTO Mira Murati 同日作证称 Altman “sowed chaos”（CNBC / US News）。

Anthropic

Code w/ Claude SF 5/6 主旨堆栈：Claude Opus 4.7 GA、Code Review GA（Anthropic 内部全员使用）、Claude Code Web/Desktop GA、Routines（schedule / GitHub event / API 触发 async agent）、Managed Agents 三件套（multi-agent orchestration、Outcomes、Dreaming research preview）；API 用量 YoY 17×，Claude Code 5h 配额翻倍（Simon Willison live blog / Anthropic news / Claude Code Review）。
SpaceX Colossus 1（5/6）：300MW+ 容量 / 220K+ NVIDIA H100/H200/GB200 GPU，“在月内"上线，并表态愿与 SpaceX 共同开发数 GW 级"轨道 AI 算力”（Anthropic / CNBC / SiliconANGLE）。
Wall Street 全栈进攻（5/5）：Jamie Dimon 站台，10 个财服 agent 模板 + Microsoft 365 全家桶 GA + Moody’s 600M+ 公司信用数据库内嵌（Anthropic / Fortune）。

Google DeepMind

Gemini 3.2 Flash 5/5 漏出 iOS App + AI Studio：定价 $0.25 / $2.00 per 1M tokens，性能逼近 3.1 Pro（报道）。
Gemini in Google Sheets 5/6 全量推送：SpreadsheetBench 自主率 70.48%（Workspace Updates）。

xAI

通过 SpaceX-Anthropic Colossus 1 算力交易间接出现：xAI 发布与 Anthropic 配套合作公告（xAI）。当日无独立产品端发布。

Mistral

维持 5/2 Mistral Medium 3.5 + Vibe Remote Agents（128B dense / 256K context / SWE-Bench Verified 77.6%）作为开源旗舰存量主线（Mistral）。

Qwen

5 月暂无新旗舰发布；当周仍处 4 月 Qwen3.6 系列存量复盘窗口，no high-confidence incremental signal。

DeepSeek

5/6 据 FT 报道 $45B 首轮 VC 谈判：领投方为"国家集成电路产业投资基金"（中国大基金），Tencent / Alibaba 在协商加入；DeepSeek 已被优化适配 Huawei / Cambricon（Bloomberg / TechCrunch）。

未确认 / Watchlist

Anthropic 与 SpaceX 数 GW 级"轨道 AI 算力"目前仅停留在表态层。
Gemini 3.2 Flash 漏出价格 / I/O 上线时点未有 Google 官方确认。
Anthropic Dreaming research preview 仅 keynote demo，未见独立基准。

关键人物与社区信号

5/5-5/6 关键人物围绕 Anthropic Code w/ Claude SF 与 OpenAI 庭审密集发声。Simon Willison 现场 live blog 整场 keynote；Boris Cherny 正式从 PR 内的 README 挤进主舞台演讲——首次以 Claude Code 主理人身份介绍 Routines；Anthropic CPO Ami Vora、Head of Product Cat Wu、Head of Product for Research Dianne Penn 同台贡献 PM 视角；OpenAI 侧 Greg Brockman 5/5-5/6 二度作证回应 Musk-Altman 庭审，前 OpenAI CTO Mira Murati 5/6 在同一庭上作证称 Altman “sowed chaos”。

Simon Willison（simonw） — 5/6 现场 live blog；blog 内逐段记录 Ami Vora / Dianne Penn / Cat Wu / Boris Cherny 演讲（live blog）。
Boris Cherny（bcherny） — 5/6 主舞台介绍 Routines：“With Routines, developers can setup async automations and wake up to PRs that are ready to merge.”（live blog / CNBC video）。
Greg Brockman（gdb） — 5/5-5/6 Musk vs OpenAI 第六日庭审二度出庭（CNBC / TechCrunch）。
Sam Altman（sama） — Musk 5/2 庭前短信"By the end of this week, you and Sam will be the most hated men in America."由 OpenAI 提交法庭（TechCrunch）。
Logan Kilpatrick — 5/5 Gemini 3.2 Flash leak 期间维持 Gemini API 公开节奏，no single-day artifact。
Misha Laskin / Ioannis Antonoglou（Reflection AI） — 5/1 Pentagon 八合同成员，作为"美国 open frontier vs DeepSeek"政治主线锚点。
Liang Wenfeng（DeepSeek） — 5/6 FT 报道把其管理层节奏推入资本结构调整阶段；本人未公开发声。

Energy

5/4 美国 2026 年规划数据中心约半数被推迟或取消：高功率变压器交期延到 5 年但 AI 数据中心建设周期普遍 < 18 个月；2026-2030 美国数据中心容量 24 GW → 100 GW 节奏受关键电气元件供应链限制（24/7 Wall St.）。
AI 数据中心电力市场结构性切向天然气：2025-2026 非可再生能源装机环比增 71%，可再生增长仅 2%；1 月得州 GW Ranch 7.7 GW 燃气项目获批（American Action Forum）。
Anthropic 5/6 表态愿与 SpaceX 共同开发数 GW 级在轨 AI 算力：把 frontier-lab 算力扩张延展至轨道 + 太阳光照场景（仍属表态层）（Anthropic / Inc.）。

Chips

DeepSeek $45B 首轮谈判（5/6）：中国大基金领投 + Tencent / Alibaba 跟投，是中国"模型 + 芯片"国产化资本撮合首例（Bloomberg / TechCrunch）。
Nvidia 中国 0% 市占 + H200 准入悬空：黄仁勋承认市占归零；CFO Colette Kress 称已批量 H200 仍未产生中国营收；北京据称要求中国厂商暂停采购（Tom’s Hardware / Quartz）。
Anthropic-SpaceX Colossus 1 5/6 接管：220K NVIDIA H100/H200/GB200 GPU + 300MW+ 电力，是当周最大单一 frontier-lab 算力交易（CNBC / DCD）。

Infra

5/6 Anthropic 接管 Colossus 1：Memphis 数据中心由 xAI 2024 年用 Electrolux 老厂改建，是世界规模最大的 AI 超算之一（Anthropic / SiliconRepublic）。
5/4 OpenAI 模型登陆 AWS Bedrock（Limited preview）：与 4/27 Microsoft-OpenAI 重构后 Microsoft “no longer right of first refusal” 一致，OpenAI 自此可在 Azure / AWS 双云铺货（AWS Blog / Microsoft Blog）。
5/1 Pentagon IL6/IL7 八合同：OpenAI / Google / Microsoft / AWS / Nvidia / SpaceX-xAI / Reflection AI / Oracle 入围，Anthropic 因拒绝 DoD 在自动武器与本土监控应用上的无限制访问被排除（CNN / Defense News）。

Model

5/5 GPT-5.5 Instant 默认化：高敏感场景幻觉降 52.5%；Plus/Pro 上线"记忆源"（OpenAI）。
5/6 Anthropic Claude Opus 4.7 GA + Code w/ Claude SF 整套堆栈升级：Code Review、Claude Code Web/Desktop、Routines、Multi-agent orchestration、Outcomes、Dreaming research preview（Simon Willison）。
5/2 Mistral Medium 3.5 公测 + Vibe Remote Agents：128B dense / 256K context / SWE-Bench Verified 77.6%（Mistral）。
5/5 Gemini 3.2 Flash 漏出 iOS App + AI Studio：$0.25 / $2.00 per 1M tokens（报道）。
Paper-digest 5/7 命中 8 篇（reasoning + agent 双主线，paper-digest 不重复 web 搜索）：
- 2605.03314 When to Think, When to Speak: Learning Disclosure Policies for LLM Reasoning — 并行推理决定何时输出，平衡延迟与正确率。
- 2605.05185 OpenSearch-VL: An Open Recipe for Frontier Multimodal Search Agents — 开源多模态搜索智能体，引入容错 GRPO 训练算法。
- 2605.00380 ResRL: Boosting LLM Reasoning via Negative Sample Projection Residual Reinforcement Learning — 残差 RL 同时提升推理与生成多样性。
- 2605.05126 ConsisVLA-4D: Spatiotemporal Consistency in 3D-Perception and 4D-Reasoning for Robotic Manipulation — 面向机器人操作的 4D 时空一致 VLA 框架。
- 2605.03269 RLDX-1 Technical Report — 多流动作 Transformer 统一灵巧操作策略。
- 2605.04128 Awaking Spatial Intelligence in Unified Multimodal Understanding and Generation — 统一理解、生成、编辑的空间智能模型。
- 2605.04637 SWE-WebDevBench: Evaluating Coding Agent Application Platforms as Virtual Software Agencies — 面向 vibe coding 平台的端到端 agent 基准。
- 2605.05166 The First Token Knows: Single-Decode Confidence for Hallucination Detection — 首 token 熵即可媲美自一致性的幻觉检测。

Application

5/6 OpenAI ‘B2B Signals’ 报告：95 分位 frontier 企业 intelligence 用量是普通企业的 3.5 倍；Codex agentic 用量差距 16 倍；message volume 仅解释 36% 差距（OpenAI）。
5/5 Anthropic Claude 财服 10 个 ready-to-run agent + Microsoft 365 全家桶 + Moody’s 内嵌：与 5/1 Pentagon 排除形成 B2B 主战场切换（Anthropic）。
5/5 EPAM ServiceNow Knowledge 2026：基于 Claude Code 的生产级 ServiceNow 开发能力；开发效率 +35%、支持 +50%（Morningstar）。
5/6 Claude Code Web / Desktop GA + Routines：Claude Code 从 CLI / IDE 扩展到 Desktop GUI 与 Web，并标准化 async 工程任务调度（Simon Willison）。
5/2 Mistral Vibe Remote Agents：异步、并行的云端编码会话进入 GitHub / Jira / Slack / Microsoft Teams（Mistral）。
paper_layer 衍生技术信号：
- Anthropic Code Review GA + Multi-agent / Outcomes / Dreaming Managed Agents（5/6）—— "agent 自我反思 + multi-agent orchestration"商业化主线发布；Dreaming 仅 keynote demo（Simon Willison）。
- OpenSearch-VL “fatal-aware GRPO” 把 multi-turn agent training 中"工具失败导致级联失败"问题做成可复现 RL 算法（HF papers）。

层间联动影响

Anthropic-SpaceX Colossus 1 (Infra) → Claude Opus 4.7 + Claude Code 配额翻倍 (Model) → Routines + Multi-agent + Code Review GA (Application)：单一交易在三层同时显形——Memphis 220K GPU + 300MW 算力直接转换为 Pro/Max 用户体验跃迁，再通过新 agent surface 转换为 Anthropic Wall Street + 创意双战场的 B2B 收入弹性。轨道 AI 算力（Energy）作为长尾延伸（Anthropic / Simon Willison）。
Pentagon 5/1 排除 Anthropic + Anthropic 5/5 Wall Street 全栈进攻 + 5/6 Claude Opus 4.7 GA：政府渠道关闭 ↔ 企业金融渠道打开 ↔ 模型与 agent 能力同步升级，三层信号在 4 天内形成完整自我修正（CNN / Anthropic 财服 / Anthropic 算力）。
DeepSeek $45B + Nvidia 中国 0% 市占（Chips） → Huawei Ascend / Cambricon Day-0 适配（Infra） → DeepSeek V4 中文圈深度复盘（Model）：中国 AI 国产化通过资本结构、芯片、模型三层一并推进；与美国侧 Anthropic-SpaceX 大额算力交易形成镜像加速（Bloomberg / TrendForce 4/29）。

🎙️ 播客动态

今日订阅播客暂无更新。

候选池变化与后续关注

5/7 候选池新增 3 位（Ami Vora / Cat Wu / Mira Murati），全部具备 5/6 当日的 ≥1 first-hand artifact 且与 Code w/ Claude SF 或 Musk-Altman 庭审两条主线直接挂钩；tracked_runtime 池中 Misha Laskin / Liang Wenfeng / Logan Kilpatrick 维持当周 watch 状态。

Ami Vora（CPO, Anthropic） → claude-code-builders：5/6 Code w/ Claude SF 主旨演讲领头人，串起 Opus 4.7、Code Review、Claude Code Web/Desktop、Routines、Managed Agents 三件套；同时是 5/5 Anthropic Wall Street 推介会的 PM 主导者（Simon Willison / Anthropic）。
Cat Wu（Head of Product, Claude Code & Cowork, Anthropic） → claude-code-builders：5/6 Code w/ Claude SF 主旨演讲台上正式介绍 Claude Code Desktop、Code Review 与 Cowork 演进；4/23 Lenny’s Newsletter 长访 + 5/6 CNBC 单访形成连续多源（Lenny’s / CNBC）。
Mira Murati（CEO, Thinking Machines Lab；ex-OpenAI CTO） → ai-generalists：5/6 Musk-Altman 庭审作证称 Altman 在 OpenAI “sowed chaos”，是 OpenAI 治理叙事最直接的 ex-insider 公开发声；同期 Thinking Machines 与 NVIDIA 1GW Vera Rubin 算力合作 + Tinker fine-tuning API 商业化（US News / NVIDIA Blog）。

后续关注：Anthropic Dreaming 是否在 5/19 London Code w/ Claude / I/O 2026 前公开 paper / 基准；DeepSeek 估值是否被三方独立官宣；Gemini 3.2 Flash 是否在 I/O 上正式确认；Meta Llama 5 时间表是否随 publishers 诉讼出现新披露。

来源与交叉验证说明

Source mix note：

primary / official：Anthropic 算力公告、Anthropic 财服、OpenAI GPT-5.5 Instant、OpenAI B2B Signals、xAI 公告、Mistral 公告、Workspace Updates、Microsoft-OpenAI 重构、Claude Code Review。
media / analysis：Bloomberg、TechCrunch、CNBC、Fortune、TheNextWeb、Tom’s Hardware、SiliconANGLE、DCD、Inc.、Reuters / FT 转引、TechNode、Defense News、CNN、24/7 Wall St.、Axios、Quartz、PC Gamer、Morningstar / PR Newswire / Stocktitan、HotHardware、Local News Matters、US News、Resultsense、HopeGirl Blog（行业评论转载）。
community / social：Simon Willison live blog / Substack、Lenny’s Newsletter Cat Wu 长访、HF papers 头部信号、CNBC video 单访。

Verification note：Anthropic-SpaceX Colossus 1 由 Anthropic 官方 + CNBC + Bloomberg + SiliconANGLE + DCD + HotHardware ≥5 源交叉确认；GPT-5.5 Instant 默认化由 OpenAI 官方 + TechCrunch + Axios 多源；Anthropic 财服 10 agent + Microsoft 365 + Moody’s 由 Anthropic 官方 + Fortune + Bloomberg + Axios + Reuters 多源；Pentagon IL6/IL7 八合同由 CNN + Defense News + Washington Post + CNBC + SiliconANGLE 多源；DeepSeek $45B 估值由 FT 原报 + Bloomberg + TechCrunch + TechNode 转引（仍处 unnamed sources，三方未官宣）；Meta publishers 诉讼由 TheNextWeb + Resultsense + Digital Watch 多源；Gemini 3.2 Flash 价格 / 路线仅 leak 渠道，列入 unverified。

Coverage gaps：

Google I/O 2026 (5/19-5/20) 前的官方静默期，本周缺少 DeepMind 直接产品发声。
Meta Llama 下一代时间表无任何 5/5-5/6 官方信号。
Mistral / xAI / Qwen 当日均无新旗舰增量发布。
paper-digest 5/7 affiliations 字段为空，扩展引用建图缺位。
中国 AI 圈个人本日 high-confidence first-hand artifact 命中为零（DeepSeek 融资为公司层信号，梁文锋未公开发声）。
Application 层 Microsoft / Google 同期具体客户案例缺位。
Anthropic Dreaming research preview 缺基准 + paper。

Confidence flags：

high-confidence-anthropic-spacex-colossus-multi-source
high-confidence-anthropic-code-with-claude-sf-multi-product-launch
high-confidence-openai-gpt55-instant-default-multi-source
high-confidence-meta-publishers-lawsuit-class-action
high-confidence-pentagon-il6-il7-eight-deal
high-confidence-paper-digest-consumed
medium-confidence-deepseek-45b-valuation-ft-bloomberg-single-line
medium-confidence-paper-affiliation-data-missing
low-confidence-gemini-3-2-flash-leak-only
low-confidence-anthropic-dreaming-no-paper

Hanzhi's BLOG

[市场·2026-05-07] AI