AI 日报｜2026-05-03

一句话结论：AI 5/3 当天的主线是"商业架构与法律框架的同步重置" — Musk v. Altman Week 1 收官 + 4/27 MS-OAI 协议次生效应让 OAI 处于"被动应对 + 多云开闸"双重状态；DeepSeek V4-Pro 拿到 NIST CAISI 5/1 正式评估被定为"落后前沿约 8 个月"，与同期 Mistral Medium 3.5 + Vibe 远程 agent 二次推介、NVIDIA Nemotron Coalition 启动一道，把"开权重 frontier vs 闭源 frontier vs agent 自我改造工具链"三种范式正式并置。

摘要

Frontier Labs：48 小时内三条主线 — (1) Musk v. Altman 一审 Week 1 收官 + 4/27 MS-OAI 重谈次生效应；(2) DeepSeek V4-Pro 拿到 NIST CAISI 5/1 评估；(3) Mistral Medium 3.5 + Vibe 远程 agent 5/2 二次推介。Anthropic / Google DeepMind / Meta / xAI / Qwen 当日无新一线产品级动作。
关键人物与社区信号：Sam Altman / Greg Brockman 因庭审与 MS 协议处于"被动应对"，无新公开博文；Karpathy 4/3-4/4 的"LLM 知识库 = 第二大脑"被 4 月底-5 月初社区放大解读；Simon Willison 5/2 Sightings 落地 Claude Code + 鸟类摄影 personal AI 用例。
5 层（Energy / Chips / Infra / Model / Application）：能源端 PJM 6GW 缺口政治放大、Meta 6+GW 核电 PPA；芯片端 Blackwell 单周 72k GPU 出货 + Vera Rubin 进入 partner availability + CoWoS 瓶颈；基建端 MS-OAI 多云 + Nemotron Coalition + Mistral Vibe；模型端 DeepSeek V4 / Mistral Medium 3.5 / Muse Spark；应用端 Gemini 进 4M GM 车、Glasswing 11 家联盟、Claude Code 5 月更新。
层间联动：电-芯片-训练三段递推、token 成本下行驱动应用层落地、模型路径分裂三种范式共存。
候选池：本日提名 3 位候选人（Misha Laskin / Tao Ge / Beidi Chen）均满足 48h 可验证 artifact + 多源 evidence 标准，建议先入观察池。

Frontier Labs / Frontier Model Radar

48 小时内的主线信号有三块：(1) OpenAI 仍被 Musk v. Altman 一审的 7 小时证词主导（CNBC 5/2 周回顾；MIT TR 5/1 Week 1），与 4/27 的 Microsoft-OpenAI 重谈形成"商业松-法庭紧"的同框；(2) DeepSeek V4-Pro 拿到 NIST CAISI 5/1 官方评估，被定位为"落后前沿约 8 个月、目前最强中国模型"，立即被 Techmeme 5/3 推上首页；(3) Mistral 5/2 在 MarkTechPost 完成 Medium 3.5 + Vibe 远程 agent 的二次推介（SWE-Bench Verified 77.6%）。

OpenAI

Musk v. Altman Week 1 收官（5/1–5/2）：Musk 加州奥克兰联邦法院 7 小时证词跨 3 天，承认 xAI “部分使用 OpenAI 模型蒸馏 Grok”，主张"You can’t just steal a charity"，请求法院罢免 Altman / Brockman 并撤销 OAI for-profit 子公司重组；Judge Gonzalez Rogers 已把审判分为 liability + remedies 两阶段，liability 预计 5/21 前结案，陪审团裁决仅供参考。(MIT TR 5/1; CNBC 5/2)
MS 协议次生效应（持续）：4/27 Microsoft–OpenAI 调整后，Azure 仅"主云"非"独家"、MSFT 对 OAI IP 许可改非独占且不再付分成、OAI 分成至 2030 但加总额上限 — Motley Fool 5/1 解读为 MSFT 长期摊薄、OAI 多云空间打开。(OpenAI 公告; Motley Fool 5/1)

Anthropic

存量主线：Opus 4.7 4/16 GA（同价 $5/$25，cyber 能力低于 Mythos Preview 但安全护栏增强）+ Project Glasswing 11 家关键基础设施公司联盟存量延续，5/3 当日无新 Anthropic 产品发布。(Opus 4.7 公告; Project Glasswing)

Google DeepMind

Gemini 进车（4/30）：与 GM 合作把 Gemini 推到约 400 万辆 2022 MY 起的 Cadillac/Chevrolet/Buick/GMC 车型替换 Google Assistant — 是 Deep Research Max（4/21）+ Gemini Robotics ER 1.6 之后的第三轮存量分发战。(TechCrunch 4/30; Deep Research Max 公告)

xAI

Musk 证词外溢（5/1）：xAI 首次官方层面承认 Grok 训练"部分依赖 OpenAI 模型蒸馏"，技术 narrative 从"自研 frontier"转向"快速跟进者"。Voice Mode 进 Apple CarPlay 与 SpaceX 6 月 IPO（目标估值 $1.75T）为后续叙事点。(TechCrunch 4/30; LatestLY)

Mistral

Medium 3.5 + Vibe 二次推介（5/2）：MarkTechPost 把 4/29 发布的 dense 128B / 256K context / 单权重融合 chat+reasoning+code 模型 SWE-Bench Verified 77.6% 推到开发者社区前台；Vibe 远程 agent 在 GitHub / Slack 沙箱里跑 bug 修复成为"agentic Medium 3.5"卖点。(MarkTechPost 5/2; Mistral 公告)

Qwen

存量主线：Qwen 3.5（397B MoE / 256K / 201 语言 / 视觉）2/16 Apache 2.0 发布后无新一代旗舰，5/3 当日无新动作。

DeepSeek

NIST CAISI 5/1 官方评估：DeepSeek V4-Pro 在 cyber / SWE / 自然科学 / 抽象推理 / 数学 5 域 benchmarks 表现"约等于 8 个月前的 GPT-5"，但在 7 项基准里 5 项比 GPT-5.4 mini 更具成本效率，被定为"目前最强中国 PRC 模型"。是对国内 narrative (“V4 已追平 Opus 4.6”) 的官方下修信号；与 75% off 促销至 5/31 形成"价格松-能力收"的对照。(NIST 5/1; Techmeme 5/3)

Unverified frontier signals

OpenAI AI-native 智能手机原型：MarketingProfs 5/1 提及 OpenAI 正在打造"以 agent 取代 app"的设备原型，无官方 confirm，仅二手综述层。归 watchlist。(MarketingProfs 5/1)
xAI / SpaceX 6 月联袂 IPO 估值 $1.75T：仅 Musk 公开口风 + 二手报道，无 S-1，归 watchlist。

关键人物与社区信号

48 小时内人物侧两条主线：(1) Sam Altman / Greg Brockman 因 Musk v. Altman 庭审与 4/27 MS-OAI 协议处于"被动应对"状态，无新公开发文；(2) Karpathy 4/3-4/4 的"LLM 知识库 + 第二大脑"被 4 月底-5 月初社区放大解读，Simon Willison 5/2 Sightings 把"Claude Code + 鸟类摄影 + iNaturalist"链路作为 personal AI 用例落地样例。

Sam Altman / Greg Brockman：庭审 Week 1 内被点名"被指控背叛 OAI 非营利使命，Musk 寻求罢免"，Altman 个人无新公开博文，OpenAI 仍以 4/26 “Our Principles” 为单一对外口径。(Ringer 4/30 庭审 annotated; CNBC 4/30 Day 4 live)
Andrej Karpathy：4/3-4/4 推出"LLM 知识库 = 个人维基"工作流（单 topic 已 ~100 articles / 400k 字），4 月底-5 月初被 Ole Lehmann 等多位社区放大解读，逐步形成"Karpathy 不写 code，写 second brain"的新 narrative。(Karpathy on X; Medium 4 月解读)
Simon Willison：5/2 Sightings 把 Claude Code 与 Canon R6 Mark II 鸟类拍摄 + iNaturalist + 生成式 AI 串成一条 personal AI 用例链。
其余跟踪人物（Boris Cherny / Amanda Askell / Alex Albert / Kevin Weil / Romain Huet / Harrison Chase / Jerry Liu / Sebastian Raschka / Jeremy Howard / Shawn Wang / Ethan Mollick / Nathan Lambert）：48 小时内未观察到突出一手公开信号；多数处于 4/27 MS-OAI 协议 + Mythos / Glasswing / Opus 4.7 系列的二次解读状态。

Energy

PJM 2027 容量缺口正式定调：PJM 12 月容量拍卖首次未达可靠性目标，缺 6.625 GW，数据中心承担 94% 增量，容量价格 $333/MW-day 创历史新高，DC Pepco 用户每月账单 +$21（约一半归因于数据中心）。Gartner 预测到 2027 年 40% AI 数据中心面临电力约束。(Spotlight PA; Utility Dive 容量拍卖; Introl 6GW 危机)
国会-州层面 5/3 政治放大：Fox News Rundown 5/3 直接以 “Voters Pay the Price as AI Centers Surge Utility Costs” 为题，表明数据中心电费已进入大众政治叙事；IEA 2025 数据中心用电 +17%，AI 数据中心用电增速远超电力总体 +3%。(Fox News 5/3; IEA)
Meta 6+GW 核电 PPA 持续生效：与 Vistra（2.1 GW Perry/Davis-Besse 20 年）、Oklo（1.2 GW 2030 年起 PJM 市场）、TerraPower（690 MW 起，目标至 2.1 GW）、Constellation 一起，是 hyperscaler 体量最大的核电采购方。(CNBC 1/9; Bloomberg 1/9)

Chips

NVIDIA Blackwell 出货：FY26 Q1 数据中心 compute 收入约 70% 来自 Blackwell，hyperscaler 平均每周部署约 1,000 NVL 72 机柜（72,000 GPU/周），Hopper 切换基本完成。(NVIDIA Q1 FY26 财报会)
Vera Rubin 进入 partner availability：Vera CPU + R100 GPU + NVLink 6 + ConnectX-9 + BlueField-4 + Spectrum-X 6 颗芯片全 TSMC 3nm，5x Blackwell 推理 / 10x token 成本下降；AWS / GCP / Azure / OCI / CoreWeave 首发 H2 2026。(Tech-Insider Vera Rubin 分析; Introl Rubin 进入全量产)
TSMC 先进封装瓶颈：CoWoS 80% CAGR 仍可能成为下一个 AI 瓶颈，NVIDIA 已锁定 TSMC 大部分 CoWoS 容量。Q1 2026 TSMC 出货 4.17M 晶圆历史新高，N7/N5/N3 占晶圆收入 74%。(CNBC 4/8 NVDA-TSMC 锁定; TSMC AI 占比)
AMD MI500-series 准备 H2 2026：CES 2026 时 Lisa Su 宣称比 MI300X 提升 1000x；MI400 临近发布。(The Register 1/7)

Infra

MS–OAI 协议 4/27 重谈次生效应：Azure 仅"主云"非"独家"、MSFT IP 许可改非独占且不再付分成、OAI 分成至 2030 但加总额上限 — 5/1 Motley Fool 解读为 MSFT 长期摊薄、OAI 多云空间打开；OAI 与 AWS 已签 $50B 投资协议。(Microsoft 公告; Motley Fool 5/1)
NVIDIA Nemotron Coalition 启动：Black Forest Labs / Cursor / LangChain / Mistral / Perplexity / Reflection AI / Sarvam / Thinking Machines Lab 8 家初创厂商联盟，目标推进 open frontier 模型，定位为对冲闭源 frontier 阵营的开权重路径。(NVIDIA 公告)
Mistral Vibe 远程 agent 上线：异步沙箱 + GitHub/Slack 集成的 agentic 开发模式，把 Medium 3.5 SWE-Bench Verified 77.6% 的能力转成生产侧入口。(MarkTechPost 5/2; Mistral 公告)

Model

DeepSeek V4 拿到 NIST CAISI 5/1 官方评估：cyber / SWE / 自然科学 / 抽象推理 / 数学 5 域基准约等于 8 个月前的 GPT-5；7 项基准里 5 项比 GPT-5.4 mini 更具成本效率；被定为"目前最强 PRC AI 模型"，但官方下修了"已追平 Opus 4.6 / GPT-5.4"的国内 narrative。叠加 75% off 促销至 5/31，是"价格松-能力收"的双面信号。(NIST 5/1; Techmeme 5/3)
Mistral Medium 3.5（dense 128B / 256K 单权重融合 chat+reasoning+code）：Le Chat 默认模型，Vibe / 远程 agent 入口生效。(Mistral 公告)
Meta Muse Spark（4/8）+ Contemplating 多 agent 模式：HLE 58% / FrontierScience 38%，闭源 + API 私测 — 5/3 当日无新一线动作，但 Meta 完全弃 Llama 开权重的战略落子已到位。(about.fb 公告)

来自 paper-digest 的论文（5/3 Top picks）

2604.24658 The Last Human-Written Paper: Agent-Native Research Artifacts — 用机器可执行 ARA 取代论文叙事；PaperBench QA 72.4%→93.7%、RE-Bench 复现率 57.4%→64.4%。
2604.21003 The Last Harness You’ll Ever Build — Worker / Evaluator / Evolution 三 agent 进化 harness，外层再 meta-evolve evolution 协议。
2604.28181 Synthetic Computers at Scale for Long-Horizon Productivity Simulation — 1000 台合成电脑、单 run >8 小时 / >2000 turn，Microsoft 系（Tao Ge / Baolin Peng / Jianfeng Gao）。
2604.27085 Efficient Training on Multiple Consumer GPUs with RoundPipe — 8×RTX 4090 上 1.48–2.16× 加速，单机即 LoRA Qwen3-235B（31K seq）。
2604.25441 Praxy Voice + 2604.25476 PSP — BUPS+LoRA 让非印度语 base 拿到商用级 Telugu/Tamil。
2604.27766 Instruction-Guided Poetry Generation in Arabic and Its Dialects — MBZUAI 系作者群，HF trending #7。

Application

Gemini 进 ~4M 辆 GM 车型（4/30）：Cadillac / Chevrolet / Buick / GMC 2022 MY+ 替换 Google Assistant，是 Deep Research Max（4/21）+ Gemini Robotics ER 1.6 之后第三轮存量分发战。(TechCrunch 4/30)
Anthropic Project Glasswing 11 家关键基础设施联盟持续生效：AWS / Apple / Broadcom / Cisco / CrowdStrike / Google / JPMorganChase / Microsoft / NVIDIA 等用 Mythos Preview 做防御性安全工作；Opus 4.7 4/16 GA。(Project Glasswing; Opus 4.7 公告)
Claude Design + Claude Code 5 月 broad update：智能模型选择、项目清理工具、permission 处理增强、OAuth 改进、Win/PowerShell 修复。(Claude Code 5/2026 更新)
xAI Grok 进 Apple CarPlay（即将）+ X 广告系统重构：Voice Mode 即将进 CarPlay 与 ChatGPT 竞争，X 广告平台已嵌入 xAI 实现端到端 AI 货币化。(LatestLY)

paper-digest 不会覆盖的技术信号

NVIDIA Nemotron Coalition 启动 — 8 家初创厂商联盟推 open frontier 模型，对冲闭源 frontier 阵营。(NVIDIA Newsroom)
EAR (2604.22868) 编辑即推理范式 — 对 image-edit 工具厂商（Adobe / Canva / Claude Design）有压力测试方向。
RADIO-ViPE (2604.26067) 单目 RGB 在线开词汇语义 SLAM — embodied / 机器人感知层降本。

层间联动影响

Energy → Infra → Model：PJM 2027 6GW 缺口推 hyperscaler 加速核电 PPA（Meta 6+GW、AWS / GCP / MSFT 持续讨论）— 这条电力供给侧约束直接限制下一代 frontier 模型（DeepSeek V4 已入 75% off 促销 + Mistral Medium 3.5 押 dense 128B）的训练 / 推理 scale-out 节奏，CoWoS 封装瓶颈再叠加，构成"电-芯片-训练"三段递推。
Chips → Model → Application：Blackwell 单周 72k GPU 出货 + Vera Rubin H2 2026 进 partner availability 让 token 成本下行预期成立，DeepSeek V4-Flash 实际计费 $0.435/$0.87 与 Mistral Medium 3.5 / Muse Spark 私测共同压低应用侧的 fair-value LLM 单价；这反过来支撑 Gemini 进车 / Glasswing / Vibe 远程 agent 等"重应用"叙事的商业化。
Infra → People → 模型路径分裂：MS-OAI 重谈让 OAI 多云分发，Nemotron Coalition 让"开权重 frontier"重新成为可投资叙事（Reflection AI / Misha Laskin 是代表）；Meta Muse Spark 弃 Llama 把"闭源 frontier"另一极推到极致 — 5/3 已能在同周看到三种范式并存：闭源、开权重 frontier、agent 自我改造工具链（ARA / Last Harness / Synthetic Computers）。

🎙️ 播客动态

今日订阅播客暂无更新。

候选池变化与后续关注

本日候选人提名：
- Misha Laskin（Reflection AI 联合创始人 / CEO，前 Google DeepMind Gemini 后训练 / reward 模型负责人，归 ai-generalists） — Reflection AI 是 Nemotron Coalition 8 家初创厂商之一，Laskin 公开发声主张"foundation of intelligence remains open — not controlled by a few"。(NVIDIA Newsroom; AI Primer 综述)
- Tao Ge（Microsoft Research / GAI Group，归 oss-ai-builders） — 5/3 paper-digest Top pick “Synthetic Computers at Scale” 一作，把"千台合成电脑作为 agent self-improvement 与 agentic RL 的基底"作为微软系正式技术信号。(arXiv 2604.28181; getao.github.io)
- Beidi Chen（CMU ECE 助理教授，归 oss-ai-builders） — 5/3 paper-digest Top pick “ARA / The Last Human-Written Paper” 37 位共同作者之一，同期 Sky Computing Lab seminar 讲 MagicPIG / GSM-Infinite。(CMU 主页; Sky Seminar)
候选池处置建议：3 位均满足"48h 内可验证 artifact + 多源 evidence"标准，但暂未达 immediate-promotion 阈值，建议先入观察池，下次报告复查活跃度后再决定升级。
下一周关注：
1. Musk v. Altman liability 阶段（5/21 前结案）后 Altman / Brockman 的公开博文 / 政策表态；
2. Karpathy LLM 知识库工具是否被任一开源项目 wrap 成独立产品；
3. Mistral / Misha Laskin 是否在 Nemotron Coalition 框架下发布联合开权重模型；
4. DeepSeek V4-Pro 75% off 促销至 5/31 后的真实定价路径；
5. Vera Rubin partner availability 期间第三方 benchmark 验证 NVDA 自宣称的 “5x Blackwell 推理 / 10x token 成本下降”。

来源与交叉验证说明

Source mix：本日以 primary / official（NIST CAISI、Microsoft、OpenAI、NVIDIA、Mistral、about.fb.com、Anthropic、IEA）为主线，叠加 media / analysis（CNBC、MIT Technology Review、Bloomberg、TechCrunch、Motley Fool、Spotlight PA、Utility Dive、CNN、Ringer、TheDecoder、MarkTechPost）和 community / social（Karpathy on X、Simon Willison 个站、blockchain.news、Medium）；company / filing 主要锚点是 NVIDIA Q1 FY26 财报会与 OpenAI / Microsoft 4/27 联合公告。

Verification note：(1) Musk v. Altman 庭审走向陪审团裁决仅供参考，最终判决由 Judge Gonzalez Rogers 决定，当前 narrative 仍可能反转；(2) CAISI 评估的非公开 benchmark 与 DeepSeek 自评估在能力评分上有 ~6 个月差距，跨源校准存在不确定性；(3) Vera Rubin “5x Blackwell 推理 / 10x token 成本下降” 数字来自 NVIDIA 自我宣称，第三方独立 benchmark 暂未发布；(4) PJM 6.625 GW 缺口与 Gartner 40% 数据中心电力受限预测属于不同方法论；(5) paper-digest 5/3 candidate JSON 的 affiliations 字段全部为空，frontier-lab / robotics-lab 命中无法机器化判断，S2 similar_papers 未返回。

Coverage gaps：(a) Anthropic / Qwen 5/3 当日无新一手公开动作；(b) 中国本土 chips 端 Huawei Ascend / 寒武纪 / 摩尔线程当日无重大新闻；© 12 位 seed 跟踪人物（除 Altman / Brockman / Karpathy / Willison）48 小时内未观察到突出一手公开信号；(d) X / Twitter 平台数据本次依赖二手综述与 search snippet；(e) 今日订阅播客暂无更新。

Hanzhi's BLOG

[市场·2026-05-03] AI