[市场·2026-05-04] AI

AI 日报|2026-05-04

一句话结论:5/1–5/4 frontier 主线被「Pentagon IL6/IL7 八厂家协议」与「Anthropic $30B ARR / $900B 估值新一轮谈判」两条线主导——OpenAI / Google / Microsoft / Amazon / Oracle / NVIDIA / SpaceX / Reflection AI 同批进入分类网络(Anthropic 因军用安全护栏被显式排除,OpenAI 同步推 GPT-5.5-Cyber 抢占国防安全应用),叠加 NVIDIA Vera Rubin 全量生产、Q1 全球 VC $300B AI 占 80%、PJM 60 GW 电力缺口承压、Mistral Medium 3.5 出货等多重事件,构成 chips→infra→model→application→energy 全链条同向放量的「结构性重组日」。

摘要

本日 4 个子章节(frontier_radar / paper_layer / people_pool / macro_news)信号集中在四条线:(1) Pentagon 5/1 IL6/IL7 协议把 8 家厂商纳入分类网络,Reflection AI 与七巨头同级,Anthropic 被显式排除;(2) Anthropic ARR $30B + 1000+ $1M+/年企业客户里程碑,叠加 $900B 估值传闻;(3) NVIDIA Vera Rubin 全量生产 + OpenAI 10 GW Vera Rubin 投产,把 chips→infra→model 串成同一资本结构;(4) paper-digest 今日 19 篇候选被 Agent / Multi-Agent 主线压制,Web2BigTable / OSCAR / Stable-GFlowNet 给 deep-research / VLM 校准 / red-teaming 各自设了新基线。社区端 Karpathy「LLM as knowledge compiler」范式转向、Simon Willison 4 月密集事实核对、Sebastian Raschka × Nathan Lambert 4.5h Lex Fridman 长访谈是本周最高密度的 OSS / 评论员信号。

Frontier Labs / Frontier Model Radar

5/1–5/4 frontier 主线被 Pentagon IL6/IL7 七厂家协议(OpenAI / Google / Microsoft / Amazon / Oracle / NVIDIA / SpaceX / Reflection AI 入选,Anthropic 因军用安全护栏被排除)与 Anthropic $30B ARR / $900B 估值新一轮谈判主导。OpenAI 同步推出 GPT-5.5-Cyber + Cybersecurity Action Plan,Mistral 4/29 上架 Medium 3.5;DeepSeek V4 / Qwen 3.5 / Gemma 4 主线本周无新版本,进入消化期。Reflection AI 借 DeepMind 系背景拿到与七大同级 IL6/IL7 资格,是本周 frontier watchlist 内首次出现的「准 frontier」厂家。

OpenAI

  • Pentagon IL6/IL7 入选 + GPT-5.5-Cyber 出货(5/1–5/4):与 Google、Microsoft、Amazon、Oracle、NVIDIA、SpaceX、Reflection AI 同批进入分类网络,部署在 GenAi.mil 平台供 130 万国防人员调用;同期发布 GPT-5.5-Cyber 与 Cybersecurity Action Plan。(CNN / Nextgov / Breaking Defense)

Anthropic

  • $30B ARR 公布同周被 Pentagon 排除(5/1–5/3):ARR 突破 $30B(5 个月内 $9B→$30B),$1M+/年企业客户从 ~500 翻至 1000+;同时被 Pentagon 显式拉出 IL6/IL7 名单(拒绝放开军用通用条款),Mythos / Project Glasswing 已扫出数千枚漏洞但未改变国防部立场。(Yahoo Finance / PYMNTS / CNN)
  • $900B 估值新一轮融资讨论曝光(4/29):CNBC 披露 Anthropic 与投资人初谈估值 $900B,超越 OpenAI 当前估值。(CNBC)

Google DeepMind

  • Pentagon IL6/IL7 入选 + Deep Research Max 已落地(4/22 + 5/1–5/4):与 OpenAI / Microsoft / Amazon 同批拿到分类网络资格;Gemini 3.1 Pro 驱动的 Deep Research Max 4/22 上线,针对长程研究 workflow,含 MCP 支持与原生可视化。(CNN / Google Blog / SiliconANGLE)

Meta

  • 本周无 frontier 模型新动作;存量战略卡位仍是 Vistra / TerraPower / Oklo / Constellation 共 ~6.6 GW 核电承诺,PJM 区 1.2 GW 校园 2030 上线。(Meta)

xAI

  • Grok 3 开源时间窗(Musk 2 月承诺)已过,权重仍未公开;本周无主线动作。

Mistral

  • 4/29 发布 Mistral Medium 3.5,本周开源端唯一 frontier 主线新版本。(Codersera)

Qwen

  • 本周无 frontier 新版本;Qwen 3.5 主线 3 月已铺完。

DeepSeek

  • 本周无 frontier 新版本;4/24 V4 Pro / V4 Flash 之后进入消化期。

未验证 frontier 信号

  • Reflection AI 与 OpenAI / Google / Microsoft / Amazon / NVIDIA / SpaceX 同批入选 Pentagon IL6/IL7,但其至今未公开发布商业 LLM;TechCrunch 报道目标为「数十万亿 token 训练的语言模型」,模型卡 / 基准未公开。该入选属 Pentagon 对「frontier 候选厂家」的押注,而非对已发布模型的认可。(TechCrunch / winbuzzer)

关键人物与社区信号

5/1–5/4 tracked-pool 主要由 Anthropic / OpenAI 高管表态和 OSS 社区评论员消化 4 月一轮 frontier 主线推动。Karpathy 4/3 宣布把主要 token 流量从写代码转向 LLM 自维护 wiki(知识编译器范式);Simon Willison 整月密集覆盖 DeepSeek V4 / GPT-5.5 / Claude 4.7 / Project Glasswing / Mythos,是 OSS 端跨厂家事实核对中枢。Brockman 4/3 起接管 OpenAI 产品组(Fidji Simo POTS 复发休假),Sam Altman 4 月仍未给 GPT-6 公开窗口。

Energy

  • Meta 已与 Vistra / TerraPower / Oklo / Constellation 签约,合计承诺 ~6.6 GW 核电;PJM 区 1.2 GW 校园 2030 上线,是 frontier-lab 在能源端最深的卡位。(Meta)
  • PJM 4/29 重启电源接入流程,811 个新发电项目排队申请并网;其中 Commonwealth Fusion Systems 申请在维州建首座核聚变电厂(早期 2030s 投运)。(Inquirer)
  • PJM 警示 2027 年起最多 60 GW 供应缺口可能导致区域停电;2026 hyperscalers 计划数据中心 capex ~$700B。(Belfer Center)

Chips

  • NVIDIA Vera Rubin 平台进入全量生产(CES 2026 公布的 7 颗新芯片,含首次集成 Groq 3 LPU);H2 2026 落地 AWS / GCP / Azure / OCI 与 CoreWeave / Lambda / Nebius / Nscale。NVIDIA 估计 Rubin 运行成本是 Blackwell 的 1/10。(NVIDIA Newsroom / Data Center Knowledge)
  • OpenAI × NVIDIA 战略协议:H2 2026 落地首批 1 GW Vera Rubin 系统,每部署 1 GW 触发 NVIDIA 累进投资,最高 $100B。(NVIDIA Newsroom)
  • Pentagon 5/1–5/4 IL6/IL7 协议把 NVIDIA 与 OpenAI / Google / Microsoft / Amazon / Oracle / SpaceX / Reflection AI 同批纳入分类网络。(CNN)

Infra

  • Pentagon 5/1–5/4 IL6/IL7 协议是本周最大 infra 主线:8 家厂商进入分类网络(OpenAI / Google / Microsoft / Amazon / Oracle / NVIDIA / SpaceX / Reflection AI),通过 GenAi.mil 平台对 130 万国防人员开放。「防 AI 厂商锁定」是国防部明示的架构原则。(Tom’s Hardware / Breaking Defense)
  • Anthropic × Google × Broadcom 三方算力扩盘:Anthropic 拿到约 3.5 GW 算力承诺(含 TPU + Broadcom 定制硅);与 4/24 Google 宣布 $40B 投资 Anthropic(首期 $10B / $35B 估值 / 5GW 算力)一脉相承。(Anthropic / Bloomberg)
  • Q1 2026 全球风险投资创纪录 ~$300B,AI 占 80%($242B);AI 基础设施类 25 笔披露融资合计 $10.64B(中位 $200M)。(Crunchbase)

Model

  • Anthropic:ARR 突破 $30B,$1M+/年客户 1000+;同周被 Pentagon 显式排除 IL6/IL7。新一轮估值 $900B(CNBC 单源);Claude Opus 4.7 4/16 GA。(PYMNTS / CNBC / GitHub Changelog)
  • OpenAI:4/23 GPT-5.5 发布(SWE-bench Pro 58.6% / Terminal-Bench 2.0 SOTA 82.7%);4 月底推出 GPT-5.5-Cyber + Cybersecurity Action Plan;Spud 即 GPT-5.5,仍属 GPT-5 家族。(Nextgov / felloai)
  • Mistral 4/29 上架 Medium 3.5。(Codersera)

来自 paper-digest 的论文

  • 2604.24026 From Skill Text to Skill Structure: The Scheduling-Structural-Logical Representation for Agent Skills — 结构化技能表征让 Agent 技能可检索可复用。
  • 2604.27221 Web2BigTable: A Bi-Level Multi-Agent LLM System for Internet-Scale Information Search and Extraction — 双层多智能体框架做互联网级搜索抽取,WideSearch 38.50 / XBench-DeepSearch 73.0 SOTA。
  • 2605.00323 Online Self-Calibration Against Hallucination in Vision-Language Models — MCTS+DPO 在线校准 VLM 幻觉。
  • 2605.00691 Learning to Act and Cooperate for Distributed Black-Box Consensus Optimization — LLM 引导的去中心化协同优化框架。
  • 2605.00414 Trees to Flows and Back: Unifying Decision Trees and Diffusion Models — 建立决策树与扩散模型的数学统一。
  • 2605.00553 Stable-GFlowNet: Toward Diverse and Robust LLM Red-Teaming via Contrastive Trajectory Balance — 去 Z 估计的稳定 GFlowNet 红队训练。

Application

  • Microsoft Agent Framework 1.0(4/3 GA):production-ready OSS,支持 .NET / Python,原生集成 MCP,含 Magentic-One 多 agent 编排;与 LangGraph / CrewAI 形成主流 agent 框架三角。(Microsoft)
  • Lukilabs Craft Agents(5/2,Apache-2.0)发布。(AIToolly)
  • Claude Code 5 月更新:智能 model 选择、project purge、ANTHROPIC_BEDROCK_SERVICE_TIER 环境变量、PR URL→/resume session 索引。(Claude Help)
  • Pentagon × GenAi.mil:8 家厂商分类网络部署直接面向 130 万国防人员,已构建数十万 AI agent。(Breaking Defense)

不在 paper-digest 内的技术信号

  • Lukilabs Craft Agents 5/2 在 Apache-2.0 下发布(同上 application 项)。
  • Karpathy nanochat 4/16 沙箱逃逸 CVE 公开(CVSS 9.8),影响全部当前版本 execution.py。(nanoGPT issue 717)

来自 paper-digest 的论文(application 子层)

  • 2604.23195 AnalogRetriever: Learning Cross-Modal Representations for Analog Circuit Retrieval — 三模态检索框架提升模拟电路搜索通过率。
  • 2605.00416 Learning while Deploying: Fleet-Scale Reinforcement Learning for Generalist Robot Policies — 集群部署边训练通用机器人策略 95% 成功。

层间联动影响

  • NVIDIA Vera Rubin(chips)→ Pentagon IL6/IL7 + OpenAI 10 GW(infra):H2 2026 首批 1 GW OpenAI Vera Rubin 系统投产,与 5/1 Pentagon 协议同期落地;NVIDIA 累进投资 OpenAI 最高 $100B 把 chips→infra→model 三层串成同一资本结构。
  • PJM 60 GW 缺口(energy)→ 5/1 Pentagon 8 家 + hyperscalers $700B 数据中心 capex(infra):能源缺口 + infra 资本同时放大,给 Meta / Oklo / Constellation 等核电卡位提供「能源即基础设施竞争力」的具体落地点。
  • Anthropic Mythos 安全护栏(model)→ Pentagon 排除(infra)vs OpenAI GPT-5.5-Cyber 入选(model+application):模型层的安全姿态直接转化为 infra/application 层的市场份额分化。
  • Reflection AI Pentagon 资格(model+infra):未公开发布商业 LLM 即获 IL6/IL7,Pentagon 在 frontier-startup 上做了与 NVIDIA $2B 同方向的押注;chips → 创业层 model 资本传导链条形成。
  • Web2BigTable 学术 SOTA(model)→ Google Deep Research Max + OpenAI Deep Research(application):开源/学术给 deep-research agent 设了第一条公开 SOTA 基线(WideSearch 38.50 / XBench 73.0)。

🎙️ 播客动态

今日订阅播客暂无更新。

候选池变化与后续关注

本日发现扫描产出 2 名达标候选人,全部由 Pentagon 5/1–5/4 IL6/IL7 入选事件触发:

  1. Misha Laskin(Reflection AI 联合创始人 / CEO)(建议归入 ai-generalists):Reflection AI 与 OpenAI / Google / Microsoft / Amazon / NVIDIA / SpaceX / Oracle 同批入选 Pentagon IL6/IL7,是七巨头之外唯一被同级纳入的初创;NVIDIA 领投 $2.13B 已落地,洽谈中下一轮 $25B 估值;Laskin 此前在 DeepMind Gemini 主导 reward modeling。(CNN / TechCrunch / Sequoia Capital)
  2. Ioannis Antonoglou(Reflection AI 联合创始人 / CTO)(建议归入 ai-generalists):AlphaGo / AlphaZero / Gemini RL 共同作者;与 Laskin 一道因 Reflection AI Pentagon 资格进入主流视野。(LinkedIn / Sequoia Capital)

促进项 promoted_people 本日为空。candidate_queue_summary:建议下次跑加入这 2 位入跟踪池后,单独建 frontier-startup-builders 分组(如有 Ineffable Intelligence David Silver / Mira Murati Thinking Machines 等同期候选可一并归入)。

来源与交叉验证说明

源类型混合:

  • primary / official:OpenAI / Anthropic / Microsoft / NVIDIA / Meta / DeepSeek / Anthropic.com 公司公告与 changelog
  • company / filing:GitHub Release Notes、Anthropic 官方融资公告
  • media / analysis:CNBC / CNN / Bloomberg / TechCrunch / Tom’s Hardware / Fortune / Reuters / Inquirer / Breaking Defense / Nextgov / Tom’s Hardware / VentureBeat / Yahoo Finance / PYMNTS
  • community / social:Simon Willison 博客(密集 4 月覆盖)、Sequoia Capital 创始人介绍页、Lex Fridman Podcast、Sebastian Raschka 博客、Andrej Karpathy X 主页、AIToolly OSS 公告

验证记录:

  • Pentagon IL6/IL7 协议:CNN + Tom’s Hardware + Breaking Defense + TechCrunch + Bloomberg + winbuzzer + Washington Post 多源跨家验证
  • Anthropic ARR $30B:Yahoo Finance + PYMNTS + ARR Club + Bloomberg 多源
  • NVIDIA Vera Rubin:NVIDIA 官方 newsroom + Data Center Knowledge + CNN + Investor Relations 三源
  • Anthropic $900B 估值:CNBC 单源(未官宣,标记 confidence_flag)
  • Reflection AI 公司层:TechCrunch + Sequoia Capital + Tracxn + LinkedIn 多源
  • paper-digest 论文消费:直接读取 2026-05-04.json top_picks[],未做二次 web 检索

coverage_gaps:

  • Reflection AI 自有模型卡 / 基准未公开
  • Anthropic $900B 估值仅 CNBC 单源未官宣
  • GPT-5.5-Cyber 具体能力 / 评测在 Nextgov 报道之外缺乏官方文档
  • paper-digest 今日 HF Daily metadata 缺 categories / affiliations,分类命中与新作者发现段被降级
  • S2 similar_papers 全部为空,论文层延伸阅读段空缺
  • 今日订阅播客无更新(podcast_fetch.py 返回空)

相关细分报告