[市场·2026-05-03] AI

AI 日报|2026-05-03

一句话结论:AI 5/3 当天的主线是"商业架构与法律框架的同步重置" — Musk v. Altman Week 1 收官 + 4/27 MS-OAI 协议次生效应让 OAI 处于"被动应对 + 多云开闸"双重状态;DeepSeek V4-Pro 拿到 NIST CAISI 5/1 正式评估被定为"落后前沿约 8 个月",与同期 Mistral Medium 3.5 + Vibe 远程 agent 二次推介、NVIDIA Nemotron Coalition 启动一道,把"开权重 frontier vs 闭源 frontier vs agent 自我改造工具链"三种范式正式并置。

摘要

  • Frontier Labs:48 小时内三条主线 — (1) Musk v. Altman 一审 Week 1 收官 + 4/27 MS-OAI 重谈次生效应;(2) DeepSeek V4-Pro 拿到 NIST CAISI 5/1 评估;(3) Mistral Medium 3.5 + Vibe 远程 agent 5/2 二次推介。Anthropic / Google DeepMind / Meta / xAI / Qwen 当日无新一线产品级动作。
  • 关键人物与社区信号:Sam Altman / Greg Brockman 因庭审与 MS 协议处于"被动应对",无新公开博文;Karpathy 4/3-4/4 的"LLM 知识库 = 第二大脑"被 4 月底-5 月初社区放大解读;Simon Willison 5/2 Sightings 落地 Claude Code + 鸟类摄影 personal AI 用例。
  • 5 层(Energy / Chips / Infra / Model / Application):能源端 PJM 6GW 缺口政治放大、Meta 6+GW 核电 PPA;芯片端 Blackwell 单周 72k GPU 出货 + Vera Rubin 进入 partner availability + CoWoS 瓶颈;基建端 MS-OAI 多云 + Nemotron Coalition + Mistral Vibe;模型端 DeepSeek V4 / Mistral Medium 3.5 / Muse Spark;应用端 Gemini 进 4M GM 车、Glasswing 11 家联盟、Claude Code 5 月更新。
  • 层间联动:电-芯片-训练三段递推、token 成本下行驱动应用层落地、模型路径分裂三种范式共存。
  • 候选池:本日提名 3 位候选人(Misha Laskin / Tao Ge / Beidi Chen)均满足 48h 可验证 artifact + 多源 evidence 标准,建议先入观察池。

Frontier Labs / Frontier Model Radar

48 小时内的主线信号有三块:(1) OpenAI 仍被 Musk v. Altman 一审的 7 小时证词主导(CNBC 5/2 周回顾MIT TR 5/1 Week 1),与 4/27 的 Microsoft-OpenAI 重谈 形成"商业松-法庭紧"的同框;(2) DeepSeek V4-Pro 拿到 NIST CAISI 5/1 官方评估,被定位为"落后前沿约 8 个月、目前最强中国模型",立即被 Techmeme 5/3 推上首页;(3) Mistral 5/2 在 MarkTechPost 完成 Medium 3.5 + Vibe 远程 agent 的二次推介(SWE-Bench Verified 77.6%)。

OpenAI

  • Musk v. Altman Week 1 收官(5/1–5/2):Musk 加州奥克兰联邦法院 7 小时证词跨 3 天,承认 xAI “部分使用 OpenAI 模型蒸馏 Grok”,主张"You can’t just steal a charity",请求法院罢免 Altman / Brockman 并撤销 OAI for-profit 子公司重组;Judge Gonzalez Rogers 已把审判分为 liability + remedies 两阶段,liability 预计 5/21 前结案,陪审团裁决仅供参考。(MIT TR 5/1; CNBC 5/2)
  • MS 协议次生效应(持续):4/27 Microsoft–OpenAI 调整后,Azure 仅"主云"非"独家"、MSFT 对 OAI IP 许可改非独占且不再付分成、OAI 分成至 2030 但加总额上限 — Motley Fool 5/1 解读为 MSFT 长期摊薄、OAI 多云空间打开。(OpenAI 公告; Motley Fool 5/1)

Anthropic

  • 存量主线:Opus 4.7 4/16 GA(同价 $5/$25,cyber 能力低于 Mythos Preview 但安全护栏增强)+ Project Glasswing 11 家关键基础设施公司联盟存量延续,5/3 当日无新 Anthropic 产品发布。(Opus 4.7 公告; Project Glasswing)

Google DeepMind

  • Gemini 进车(4/30):与 GM 合作把 Gemini 推到约 400 万辆 2022 MY 起的 Cadillac/Chevrolet/Buick/GMC 车型替换 Google Assistant — 是 Deep Research Max(4/21)+ Gemini Robotics ER 1.6 之后的第三轮存量分发战。(TechCrunch 4/30; Deep Research Max 公告)

Meta

  • 存量主线:4/8 推出 Muse Spark(多模态推理 + Contemplating 多 agent 并行模式,HLE 58% / FrontierScience 38%),完全闭源、API 仅私测、Llama 4 之后已无新开权重路线 — 5/3 当日无新动作。(about.fb 公告)

xAI

  • Musk 证词外溢(5/1):xAI 首次官方层面承认 Grok 训练"部分依赖 OpenAI 模型蒸馏",技术 narrative 从"自研 frontier"转向"快速跟进者"。Voice Mode 进 Apple CarPlay 与 SpaceX 6 月 IPO(目标估值 $1.75T)为后续叙事点。(TechCrunch 4/30; LatestLY)

Mistral

  • Medium 3.5 + Vibe 二次推介(5/2):MarkTechPost 把 4/29 发布的 dense 128B / 256K context / 单权重融合 chat+reasoning+code 模型 SWE-Bench Verified 77.6% 推到开发者社区前台;Vibe 远程 agent 在 GitHub / Slack 沙箱里跑 bug 修复成为"agentic Medium 3.5"卖点。(MarkTechPost 5/2; Mistral 公告)

Qwen

  • 存量主线:Qwen 3.5(397B MoE / 256K / 201 语言 / 视觉)2/16 Apache 2.0 发布后无新一代旗舰,5/3 当日无新动作。

DeepSeek

  • NIST CAISI 5/1 官方评估:DeepSeek V4-Pro 在 cyber / SWE / 自然科学 / 抽象推理 / 数学 5 域 benchmarks 表现"约等于 8 个月前的 GPT-5",但在 7 项基准里 5 项比 GPT-5.4 mini 更具成本效率,被定为"目前最强中国 PRC 模型"。是对国内 narrative (“V4 已追平 Opus 4.6”) 的官方下修信号;与 75% off 促销至 5/31 形成"价格松-能力收"的对照。(NIST 5/1; Techmeme 5/3)

Unverified frontier signals

  • OpenAI AI-native 智能手机原型:MarketingProfs 5/1 提及 OpenAI 正在打造"以 agent 取代 app"的设备原型,无官方 confirm,仅二手综述层。归 watchlist。(MarketingProfs 5/1)
  • xAI / SpaceX 6 月联袂 IPO 估值 $1.75T:仅 Musk 公开口风 + 二手报道,无 S-1,归 watchlist。

关键人物与社区信号

48 小时内人物侧两条主线:(1) Sam Altman / Greg Brockman 因 Musk v. Altman 庭审与 4/27 MS-OAI 协议处于"被动应对"状态,无新公开发文;(2) Karpathy 4/3-4/4 的"LLM 知识库 + 第二大脑"被 4 月底-5 月初社区放大解读,Simon Willison 5/2 Sightings 把"Claude Code + 鸟类摄影 + iNaturalist"链路作为 personal AI 用例落地样例。

  • Sam Altman / Greg Brockman:庭审 Week 1 内被点名"被指控背叛 OAI 非营利使命,Musk 寻求罢免",Altman 个人无新公开博文,OpenAI 仍以 4/26 “Our Principles” 为单一对外口径。(Ringer 4/30 庭审 annotated; CNBC 4/30 Day 4 live)
  • Andrej Karpathy:4/3-4/4 推出"LLM 知识库 = 个人维基"工作流(单 topic 已 ~100 articles / 400k 字),4 月底-5 月初被 Ole Lehmann 等多位社区放大解读,逐步形成"Karpathy 不写 code,写 second brain"的新 narrative。(Karpathy on X; Medium 4 月解读)
  • Simon Willison:5/2 Sightings 把 Claude Code 与 Canon R6 Mark II 鸟类拍摄 + iNaturalist + 生成式 AI 串成一条 personal AI 用例链。
  • 其余跟踪人物(Boris Cherny / Amanda Askell / Alex Albert / Kevin Weil / Romain Huet / Harrison Chase / Jerry Liu / Sebastian Raschka / Jeremy Howard / Shawn Wang / Ethan Mollick / Nathan Lambert):48 小时内未观察到突出一手公开信号;多数处于 4/27 MS-OAI 协议 + Mythos / Glasswing / Opus 4.7 系列的二次解读状态。

Energy

  • PJM 2027 容量缺口正式定调:PJM 12 月容量拍卖首次未达可靠性目标,缺 6.625 GW,数据中心承担 94% 增量,容量价格 $333/MW-day 创历史新高,DC Pepco 用户每月账单 +$21(约一半归因于数据中心)。Gartner 预测到 2027 年 40% AI 数据中心面临电力约束。(Spotlight PA; Utility Dive 容量拍卖; Introl 6GW 危机)
  • 国会-州层面 5/3 政治放大:Fox News Rundown 5/3 直接以 “Voters Pay the Price as AI Centers Surge Utility Costs” 为题,表明数据中心电费已进入大众政治叙事;IEA 2025 数据中心用电 +17%,AI 数据中心用电增速远超电力总体 +3%。(Fox News 5/3; IEA)
  • Meta 6+GW 核电 PPA 持续生效:与 Vistra(2.1 GW Perry/Davis-Besse 20 年)、Oklo(1.2 GW 2030 年起 PJM 市场)、TerraPower(690 MW 起,目标至 2.1 GW)、Constellation 一起,是 hyperscaler 体量最大的核电采购方。(CNBC 1/9; Bloomberg 1/9)

Chips

  • NVIDIA Blackwell 出货:FY26 Q1 数据中心 compute 收入约 70% 来自 Blackwell,hyperscaler 平均每周部署约 1,000 NVL 72 机柜(72,000 GPU/周),Hopper 切换基本完成。(NVIDIA Q1 FY26 财报会)
  • Vera Rubin 进入 partner availability:Vera CPU + R100 GPU + NVLink 6 + ConnectX-9 + BlueField-4 + Spectrum-X 6 颗芯片全 TSMC 3nm,5x Blackwell 推理 / 10x token 成本下降;AWS / GCP / Azure / OCI / CoreWeave 首发 H2 2026。(Tech-Insider Vera Rubin 分析; Introl Rubin 进入全量产)
  • TSMC 先进封装瓶颈:CoWoS 80% CAGR 仍可能成为下一个 AI 瓶颈,NVIDIA 已锁定 TSMC 大部分 CoWoS 容量。Q1 2026 TSMC 出货 4.17M 晶圆历史新高,N7/N5/N3 占晶圆收入 74%。(CNBC 4/8 NVDA-TSMC 锁定; TSMC AI 占比)
  • AMD MI500-series 准备 H2 2026:CES 2026 时 Lisa Su 宣称比 MI300X 提升 1000x;MI400 临近发布。(The Register 1/7)

Infra

  • MS–OAI 协议 4/27 重谈次生效应:Azure 仅"主云"非"独家"、MSFT IP 许可改非独占且不再付分成、OAI 分成至 2030 但加总额上限 — 5/1 Motley Fool 解读为 MSFT 长期摊薄、OAI 多云空间打开;OAI 与 AWS 已签 $50B 投资协议。(Microsoft 公告; Motley Fool 5/1)
  • NVIDIA Nemotron Coalition 启动:Black Forest Labs / Cursor / LangChain / Mistral / Perplexity / Reflection AI / Sarvam / Thinking Machines Lab 8 家初创厂商联盟,目标推进 open frontier 模型,定位为对冲闭源 frontier 阵营的开权重路径。(NVIDIA 公告)
  • Mistral Vibe 远程 agent 上线:异步沙箱 + GitHub/Slack 集成的 agentic 开发模式,把 Medium 3.5 SWE-Bench Verified 77.6% 的能力转成生产侧入口。(MarkTechPost 5/2; Mistral 公告)

Model

  • DeepSeek V4 拿到 NIST CAISI 5/1 官方评估:cyber / SWE / 自然科学 / 抽象推理 / 数学 5 域基准约等于 8 个月前的 GPT-5;7 项基准里 5 项比 GPT-5.4 mini 更具成本效率;被定为"目前最强 PRC AI 模型",但官方下修了"已追平 Opus 4.6 / GPT-5.4"的国内 narrative。叠加 75% off 促销至 5/31,是"价格松-能力收"的双面信号。(NIST 5/1; Techmeme 5/3)
  • Mistral Medium 3.5(dense 128B / 256K 单权重融合 chat+reasoning+code):Le Chat 默认模型,Vibe / 远程 agent 入口生效。(Mistral 公告)
  • Meta Muse Spark(4/8)+ Contemplating 多 agent 模式:HLE 58% / FrontierScience 38%,闭源 + API 私测 — 5/3 当日无新一线动作,但 Meta 完全弃 Llama 开权重的战略落子已到位。(about.fb 公告)

来自 paper-digest 的论文(5/3 Top picks)

  • 2604.24658 The Last Human-Written Paper: Agent-Native Research Artifacts — 用机器可执行 ARA 取代论文叙事;PaperBench QA 72.4%→93.7%、RE-Bench 复现率 57.4%→64.4%。
  • 2604.21003 The Last Harness You’ll Ever Build — Worker / Evaluator / Evolution 三 agent 进化 harness,外层再 meta-evolve evolution 协议。
  • 2604.28181 Synthetic Computers at Scale for Long-Horizon Productivity Simulation — 1000 台合成电脑、单 run >8 小时 / >2000 turn,Microsoft 系(Tao Ge / Baolin Peng / Jianfeng Gao)。
  • 2604.27085 Efficient Training on Multiple Consumer GPUs with RoundPipe — 8×RTX 4090 上 1.48–2.16× 加速,单机即 LoRA Qwen3-235B(31K seq)。
  • 2604.25441 Praxy Voice + 2604.25476 PSP — BUPS+LoRA 让非印度语 base 拿到商用级 Telugu/Tamil。
  • 2604.27766 Instruction-Guided Poetry Generation in Arabic and Its Dialects — MBZUAI 系作者群,HF trending #7。

Application

  • Gemini 进 ~4M 辆 GM 车型(4/30):Cadillac / Chevrolet / Buick / GMC 2022 MY+ 替换 Google Assistant,是 Deep Research Max(4/21)+ Gemini Robotics ER 1.6 之后第三轮存量分发战。(TechCrunch 4/30)
  • Anthropic Project Glasswing 11 家关键基础设施联盟持续生效:AWS / Apple / Broadcom / Cisco / CrowdStrike / Google / JPMorganChase / Microsoft / NVIDIA 等用 Mythos Preview 做防御性安全工作;Opus 4.7 4/16 GA。(Project Glasswing; Opus 4.7 公告)
  • Claude Design + Claude Code 5 月 broad update:智能模型选择、项目清理工具、permission 处理增强、OAuth 改进、Win/PowerShell 修复。(Claude Code 5/2026 更新)
  • xAI Grok 进 Apple CarPlay(即将)+ X 广告系统重构:Voice Mode 即将进 CarPlay 与 ChatGPT 竞争,X 广告平台已嵌入 xAI 实现端到端 AI 货币化。(LatestLY)

paper-digest 不会覆盖的技术信号

  • NVIDIA Nemotron Coalition 启动 — 8 家初创厂商联盟推 open frontier 模型,对冲闭源 frontier 阵营。(NVIDIA Newsroom)
  • EAR (2604.22868) 编辑即推理范式 — 对 image-edit 工具厂商(Adobe / Canva / Claude Design)有压力测试方向。
  • RADIO-ViPE (2604.26067) 单目 RGB 在线开词汇语义 SLAM — embodied / 机器人感知层降本。

层间联动影响

  • Energy → Infra → Model:PJM 2027 6GW 缺口推 hyperscaler 加速核电 PPA(Meta 6+GW、AWS / GCP / MSFT 持续讨论)— 这条电力供给侧约束直接限制下一代 frontier 模型(DeepSeek V4 已入 75% off 促销 + Mistral Medium 3.5 押 dense 128B)的训练 / 推理 scale-out 节奏,CoWoS 封装瓶颈再叠加,构成"电-芯片-训练"三段递推。
  • Chips → Model → Application:Blackwell 单周 72k GPU 出货 + Vera Rubin H2 2026 进 partner availability 让 token 成本下行预期成立,DeepSeek V4-Flash 实际计费 $0.435/$0.87 与 Mistral Medium 3.5 / Muse Spark 私测共同压低应用侧的 fair-value LLM 单价;这反过来支撑 Gemini 进车 / Glasswing / Vibe 远程 agent 等"重应用"叙事的商业化。
  • Infra → People → 模型路径分裂:MS-OAI 重谈让 OAI 多云分发,Nemotron Coalition 让"开权重 frontier"重新成为可投资叙事(Reflection AI / Misha Laskin 是代表);Meta Muse Spark 弃 Llama 把"闭源 frontier"另一极推到极致 — 5/3 已能在同周看到三种范式并存:闭源、开权重 frontier、agent 自我改造工具链(ARA / Last Harness / Synthetic Computers)。

🎙️ 播客动态

今日订阅播客暂无更新。

候选池变化与后续关注

  • 本日候选人提名
    • Misha Laskin(Reflection AI 联合创始人 / CEO,前 Google DeepMind Gemini 后训练 / reward 模型负责人,归 ai-generalists — Reflection AI 是 Nemotron Coalition 8 家初创厂商之一,Laskin 公开发声主张"foundation of intelligence remains open — not controlled by a few"。(NVIDIA Newsroom; AI Primer 综述)
    • Tao Ge(Microsoft Research / GAI Group,归 oss-ai-builders — 5/3 paper-digest Top pick “Synthetic Computers at Scale” 一作,把"千台合成电脑作为 agent self-improvement 与 agentic RL 的基底"作为微软系正式技术信号。(arXiv 2604.28181; getao.github.io)
    • Beidi Chen(CMU ECE 助理教授,归 oss-ai-builders — 5/3 paper-digest Top pick “ARA / The Last Human-Written Paper” 37 位共同作者之一,同期 Sky Computing Lab seminar 讲 MagicPIG / GSM-Infinite。(CMU 主页; Sky Seminar)
  • 候选池处置建议:3 位均满足"48h 内可验证 artifact + 多源 evidence"标准,但暂未达 immediate-promotion 阈值,建议先入观察池,下次报告复查活跃度后再决定升级。
  • 下一周关注
    1. Musk v. Altman liability 阶段(5/21 前结案)后 Altman / Brockman 的公开博文 / 政策表态;
    2. Karpathy LLM 知识库工具是否被任一开源项目 wrap 成独立产品;
    3. Mistral / Misha Laskin 是否在 Nemotron Coalition 框架下发布联合开权重模型;
    4. DeepSeek V4-Pro 75% off 促销至 5/31 后的真实定价路径;
    5. Vera Rubin partner availability 期间第三方 benchmark 验证 NVDA 自宣称的 “5x Blackwell 推理 / 10x token 成本下降”。

来源与交叉验证说明

Source mix:本日以 primary / official(NIST CAISI、Microsoft、OpenAI、NVIDIA、Mistral、about.fb.com、Anthropic、IEA)为主线,叠加 media / analysis(CNBC、MIT Technology Review、Bloomberg、TechCrunch、Motley Fool、Spotlight PA、Utility Dive、CNN、Ringer、TheDecoder、MarkTechPost)和 community / social(Karpathy on X、Simon Willison 个站、blockchain.news、Medium);company / filing 主要锚点是 NVIDIA Q1 FY26 财报会与 OpenAI / Microsoft 4/27 联合公告。

Verification note:(1) Musk v. Altman 庭审走向陪审团裁决仅供参考,最终判决由 Judge Gonzalez Rogers 决定,当前 narrative 仍可能反转;(2) CAISI 评估的非公开 benchmark 与 DeepSeek 自评估在能力评分上有 ~6 个月差距,跨源校准存在不确定性;(3) Vera Rubin “5x Blackwell 推理 / 10x token 成本下降” 数字来自 NVIDIA 自我宣称,第三方独立 benchmark 暂未发布;(4) PJM 6.625 GW 缺口与 Gartner 40% 数据中心电力受限预测属于不同方法论;(5) paper-digest 5/3 candidate JSON 的 affiliations 字段全部为空,frontier-lab / robotics-lab 命中无法机器化判断,S2 similar_papers 未返回。

Coverage gaps:(a) Anthropic / Qwen 5/3 当日无新一手公开动作;(b) 中国本土 chips 端 Huawei Ascend / 寒武纪 / 摩尔线程当日无重大新闻;© 12 位 seed 跟踪人物(除 Altman / Brockman / Karpathy / Willison)48 小时内未观察到突出一手公开信号;(d) X / Twitter 平台数据本次依赖二手综述与 search snippet;(e) 今日订阅播客暂无更新。