AI 日报｜2026-05-04

一句话结论：5/1–5/4 frontier 主线被「Pentagon IL6/IL7 八厂家协议」与「Anthropic $30B ARR / $900B 估值新一轮谈判」两条线主导——OpenAI / Google / Microsoft / Amazon / Oracle / NVIDIA / SpaceX / Reflection AI 同批进入分类网络（Anthropic 因军用安全护栏被显式排除，OpenAI 同步推 GPT-5.5-Cyber 抢占国防安全应用），叠加 NVIDIA Vera Rubin 全量生产、Q1 全球 VC $300B AI 占 80%、PJM 60 GW 电力缺口承压、Mistral Medium 3.5 出货等多重事件，构成 chips→infra→model→application→energy 全链条同向放量的「结构性重组日」。

摘要

本日 4 个子章节（frontier_radar / paper_layer / people_pool / macro_news）信号集中在四条线：(1) Pentagon 5/1 IL6/IL7 协议把 8 家厂商纳入分类网络，Reflection AI 与七巨头同级，Anthropic 被显式排除；(2) Anthropic ARR $30B + 1000+ $1M+/年企业客户里程碑，叠加 $900B 估值传闻；(3) NVIDIA Vera Rubin 全量生产 + OpenAI 10 GW Vera Rubin 投产，把 chips→infra→model 串成同一资本结构；(4) paper-digest 今日 19 篇候选被 Agent / Multi-Agent 主线压制，Web2BigTable / OSCAR / Stable-GFlowNet 给 deep-research / VLM 校准 / red-teaming 各自设了新基线。社区端 Karpathy「LLM as knowledge compiler」范式转向、Simon Willison 4 月密集事实核对、Sebastian Raschka × Nathan Lambert 4.5h Lex Fridman 长访谈是本周最高密度的 OSS / 评论员信号。

Frontier Labs / Frontier Model Radar

5/1–5/4 frontier 主线被 Pentagon IL6/IL7 七厂家协议（OpenAI / Google / Microsoft / Amazon / Oracle / NVIDIA / SpaceX / Reflection AI 入选，Anthropic 因军用安全护栏被排除）与 Anthropic $30B ARR / $900B 估值新一轮谈判主导。OpenAI 同步推出 GPT-5.5-Cyber + Cybersecurity Action Plan，Mistral 4/29 上架 Medium 3.5；DeepSeek V4 / Qwen 3.5 / Gemma 4 主线本周无新版本，进入消化期。Reflection AI 借 DeepMind 系背景拿到与七大同级 IL6/IL7 资格，是本周 frontier watchlist 内首次出现的「准 frontier」厂家。

OpenAI

Pentagon IL6/IL7 入选 + GPT-5.5-Cyber 出货（5/1–5/4）：与 Google、Microsoft、Amazon、Oracle、NVIDIA、SpaceX、Reflection AI 同批进入分类网络，部署在 GenAi.mil 平台供 130 万国防人员调用；同期发布 GPT-5.5-Cyber 与 Cybersecurity Action Plan。(CNN / Nextgov / Breaking Defense)

Anthropic

$30B ARR 公布同周被 Pentagon 排除（5/1–5/3）：ARR 突破 $30B（5 个月内 $9B→$30B），$1M+/年企业客户从 ~500 翻至 1000+；同时被 Pentagon 显式拉出 IL6/IL7 名单（拒绝放开军用通用条款），Mythos / Project Glasswing 已扫出数千枚漏洞但未改变国防部立场。(Yahoo Finance / PYMNTS / CNN)
$900B 估值新一轮融资讨论曝光（4/29）：CNBC 披露 Anthropic 与投资人初谈估值 $900B，超越 OpenAI 当前估值。(CNBC)

Google DeepMind

Pentagon IL6/IL7 入选 + Deep Research Max 已落地（4/22 + 5/1–5/4）：与 OpenAI / Microsoft / Amazon 同批拿到分类网络资格；Gemini 3.1 Pro 驱动的 Deep Research Max 4/22 上线，针对长程研究 workflow，含 MCP 支持与原生可视化。(CNN / Google Blog / SiliconANGLE)

xAI

Grok 3 开源时间窗（Musk 2 月承诺）已过，权重仍未公开；本周无主线动作。

Mistral

4/29 发布 Mistral Medium 3.5，本周开源端唯一 frontier 主线新版本。(Codersera)

Qwen

本周无 frontier 新版本；Qwen 3.5 主线 3 月已铺完。

DeepSeek

本周无 frontier 新版本；4/24 V4 Pro / V4 Flash 之后进入消化期。

未验证 frontier 信号

Reflection AI 与 OpenAI / Google / Microsoft / Amazon / NVIDIA / SpaceX 同批入选 Pentagon IL6/IL7，但其至今未公开发布商业 LLM；TechCrunch 报道目标为「数十万亿 token 训练的语言模型」，模型卡 / 基准未公开。该入选属 Pentagon 对「frontier 候选厂家」的押注，而非对已发布模型的认可。(TechCrunch / winbuzzer)

关键人物与社区信号

5/1–5/4 tracked-pool 主要由 Anthropic / OpenAI 高管表态和 OSS 社区评论员消化 4 月一轮 frontier 主线推动。Karpathy 4/3 宣布把主要 token 流量从写代码转向 LLM 自维护 wiki（知识编译器范式）；Simon Willison 整月密集覆盖 DeepSeek V4 / GPT-5.5 / Claude 4.7 / Project Glasswing / Mythos，是 OSS 端跨厂家事实核对中枢。Brockman 4/3 起接管 OpenAI 产品组（Fidji Simo POTS 复发休假），Sam Altman 4 月仍未给 GPT-6 公开窗口。

Andrej Karpathy（4/3, X）：「a large fraction of my recent token throughput is going less into manipulating code, and more into manipulating knowledge」，发布个人 wiki 范式（100 篇文章 / 40 万字，由 LLM 自维护）。(Medium 复盘)
Simon Willison（4/7, 4/14, 4/18, 4/22, 4/23, 4/24, 4/27）：整月密集发文：Project Glasswing 限制 Mythos → GPT-5.4-Cyber 框架 → Claude Opus 4.6→4.7 system prompt diff → Claude Code $100/月辨析 → GPT-5.5 pelican 测试 → DeepSeek V4 上手 → Microsoft-OpenAI AGI 条款消亡考。
Sam Altman（4 月持续）：3/24 公布 Spud 模型预训练完成、「几周后发布」；4/23 该模型最终以 GPT-5.5 名义出货（仍属 GPT-5 家族），GPT-6 公开窗口本月未给出。(felloai 时间线)
Greg Brockman（4/3 起）：Fidji Simo POTS 复发开始医疗休假，OpenAI 产品组改由 Brockman 接管；Jason Kwon / Sarah Friar / Denise Dresser 分担业务/运营。(Fortune / Bloomberg)
Sebastian Raschka × Nathan Lambert（Lex Fridman #490）：4.5 小时 State of AI 2026 长访谈，覆盖中国开源、coding agent、scaling、agents、GPU、AGI；提出「AI 在日常生活影响层面可能进入 plateau」的非共识判断。(sebastianraschka.com)

Energy

Meta 已与 Vistra / TerraPower / Oklo / Constellation 签约，合计承诺 ~6.6 GW 核电；PJM 区 1.2 GW 校园 2030 上线，是 frontier-lab 在能源端最深的卡位。(Meta)
PJM 4/29 重启电源接入流程，811 个新发电项目排队申请并网；其中 Commonwealth Fusion Systems 申请在维州建首座核聚变电厂（早期 2030s 投运）。(Inquirer)
PJM 警示 2027 年起最多 60 GW 供应缺口可能导致区域停电；2026 hyperscalers 计划数据中心 capex ~$700B。(Belfer Center)

Chips

NVIDIA Vera Rubin 平台进入全量生产（CES 2026 公布的 7 颗新芯片，含首次集成 Groq 3 LPU）；H2 2026 落地 AWS / GCP / Azure / OCI 与 CoreWeave / Lambda / Nebius / Nscale。NVIDIA 估计 Rubin 运行成本是 Blackwell 的 1/10。(NVIDIA Newsroom / Data Center Knowledge)
OpenAI × NVIDIA 战略协议：H2 2026 落地首批 1 GW Vera Rubin 系统，每部署 1 GW 触发 NVIDIA 累进投资，最高 $100B。(NVIDIA Newsroom)
Pentagon 5/1–5/4 IL6/IL7 协议把 NVIDIA 与 OpenAI / Google / Microsoft / Amazon / Oracle / SpaceX / Reflection AI 同批纳入分类网络。(CNN)

Infra

Pentagon 5/1–5/4 IL6/IL7 协议是本周最大 infra 主线：8 家厂商进入分类网络（OpenAI / Google / Microsoft / Amazon / Oracle / NVIDIA / SpaceX / Reflection AI），通过 GenAi.mil 平台对 130 万国防人员开放。「防 AI 厂商锁定」是国防部明示的架构原则。(Tom’s Hardware / Breaking Defense)
Anthropic × Google × Broadcom 三方算力扩盘：Anthropic 拿到约 3.5 GW 算力承诺（含 TPU + Broadcom 定制硅）；与 4/24 Google 宣布 $40B 投资 Anthropic（首期 $10B / $35B 估值 / 5GW 算力）一脉相承。(Anthropic / Bloomberg)
Q1 2026 全球风险投资创纪录 ~$300B，AI 占 80%（$242B）；AI 基础设施类 25 笔披露融资合计 $10.64B（中位 $200M）。(Crunchbase)

Model

Anthropic：ARR 突破 $30B，$1M+/年客户 1000+；同周被 Pentagon 显式排除 IL6/IL7。新一轮估值 $900B（CNBC 单源）；Claude Opus 4.7 4/16 GA。(PYMNTS / CNBC / GitHub Changelog)
OpenAI：4/23 GPT-5.5 发布（SWE-bench Pro 58.6% / Terminal-Bench 2.0 SOTA 82.7%）；4 月底推出 GPT-5.5-Cyber + Cybersecurity Action Plan；Spud 即 GPT-5.5，仍属 GPT-5 家族。(Nextgov / felloai)
Mistral 4/29 上架 Medium 3.5。(Codersera)

来自 paper-digest 的论文

2604.24026 From Skill Text to Skill Structure: The Scheduling-Structural-Logical Representation for Agent Skills — 结构化技能表征让 Agent 技能可检索可复用。
2604.27221 Web2BigTable: A Bi-Level Multi-Agent LLM System for Internet-Scale Information Search and Extraction — 双层多智能体框架做互联网级搜索抽取，WideSearch 38.50 / XBench-DeepSearch 73.0 SOTA。
2605.00323 Online Self-Calibration Against Hallucination in Vision-Language Models — MCTS+DPO 在线校准 VLM 幻觉。
2605.00691 Learning to Act and Cooperate for Distributed Black-Box Consensus Optimization — LLM 引导的去中心化协同优化框架。
2605.00414 Trees to Flows and Back: Unifying Decision Trees and Diffusion Models — 建立决策树与扩散模型的数学统一。
2605.00553 Stable-GFlowNet: Toward Diverse and Robust LLM Red-Teaming via Contrastive Trajectory Balance — 去 Z 估计的稳定 GFlowNet 红队训练。

Application

Microsoft Agent Framework 1.0（4/3 GA）：production-ready OSS，支持 .NET / Python，原生集成 MCP，含 Magentic-One 多 agent 编排；与 LangGraph / CrewAI 形成主流 agent 框架三角。(Microsoft)
Lukilabs Craft Agents（5/2，Apache-2.0）发布。(AIToolly)
Claude Code 5 月更新：智能 model 选择、project purge、ANTHROPIC_BEDROCK_SERVICE_TIER 环境变量、PR URL→/resume session 索引。(Claude Help)
Pentagon × GenAi.mil：8 家厂商分类网络部署直接面向 130 万国防人员，已构建数十万 AI agent。(Breaking Defense)

不在 paper-digest 内的技术信号

Lukilabs Craft Agents 5/2 在 Apache-2.0 下发布（同上 application 项）。
Karpathy nanochat 4/16 沙箱逃逸 CVE 公开（CVSS 9.8），影响全部当前版本 execution.py。(nanoGPT issue 717)

来自 paper-digest 的论文（application 子层）

2604.23195 AnalogRetriever: Learning Cross-Modal Representations for Analog Circuit Retrieval — 三模态检索框架提升模拟电路搜索通过率。
2605.00416 Learning while Deploying: Fleet-Scale Reinforcement Learning for Generalist Robot Policies — 集群部署边训练通用机器人策略 95% 成功。

层间联动影响

NVIDIA Vera Rubin（chips）→ Pentagon IL6/IL7 + OpenAI 10 GW（infra）：H2 2026 首批 1 GW OpenAI Vera Rubin 系统投产，与 5/1 Pentagon 协议同期落地；NVIDIA 累进投资 OpenAI 最高 $100B 把 chips→infra→model 三层串成同一资本结构。
PJM 60 GW 缺口（energy）→ 5/1 Pentagon 8 家 + hyperscalers $700B 数据中心 capex（infra）：能源缺口 + infra 资本同时放大，给 Meta / Oklo / Constellation 等核电卡位提供「能源即基础设施竞争力」的具体落地点。
Anthropic Mythos 安全护栏（model）→ Pentagon 排除（infra）vs OpenAI GPT-5.5-Cyber 入选（model+application）：模型层的安全姿态直接转化为 infra/application 层的市场份额分化。
Reflection AI Pentagon 资格（model+infra）：未公开发布商业 LLM 即获 IL6/IL7，Pentagon 在 frontier-startup 上做了与 NVIDIA $2B 同方向的押注；chips → 创业层 model 资本传导链条形成。
Web2BigTable 学术 SOTA（model）→ Google Deep Research Max + OpenAI Deep Research（application）：开源/学术给 deep-research agent 设了第一条公开 SOTA 基线（WideSearch 38.50 / XBench 73.0）。

🎙️ 播客动态

今日订阅播客暂无更新。

候选池变化与后续关注

本日发现扫描产出 2 名达标候选人，全部由 Pentagon 5/1–5/4 IL6/IL7 入选事件触发：

Misha Laskin（Reflection AI 联合创始人 / CEO）（建议归入 ai-generalists）：Reflection AI 与 OpenAI / Google / Microsoft / Amazon / NVIDIA / SpaceX / Oracle 同批入选 Pentagon IL6/IL7，是七巨头之外唯一被同级纳入的初创；NVIDIA 领投 $2.13B 已落地，洽谈中下一轮 $25B 估值；Laskin 此前在 DeepMind Gemini 主导 reward modeling。(CNN / TechCrunch / Sequoia Capital)
Ioannis Antonoglou（Reflection AI 联合创始人 / CTO）（建议归入 ai-generalists）：AlphaGo / AlphaZero / Gemini RL 共同作者；与 Laskin 一道因 Reflection AI Pentagon 资格进入主流视野。(LinkedIn / Sequoia Capital)

促进项 promoted_people 本日为空。candidate_queue_summary：建议下次跑加入这 2 位入跟踪池后，单独建 frontier-startup-builders 分组（如有 Ineffable Intelligence David Silver / Mira Murati Thinking Machines 等同期候选可一并归入）。

来源与交叉验证说明

源类型混合：

primary / official：OpenAI / Anthropic / Microsoft / NVIDIA / Meta / DeepSeek / Anthropic.com 公司公告与 changelog
company / filing：GitHub Release Notes、Anthropic 官方融资公告
media / analysis：CNBC / CNN / Bloomberg / TechCrunch / Tom’s Hardware / Fortune / Reuters / Inquirer / Breaking Defense / Nextgov / Tom’s Hardware / VentureBeat / Yahoo Finance / PYMNTS
community / social：Simon Willison 博客（密集 4 月覆盖）、Sequoia Capital 创始人介绍页、Lex Fridman Podcast、Sebastian Raschka 博客、Andrej Karpathy X 主页、AIToolly OSS 公告

验证记录：

Pentagon IL6/IL7 协议：CNN + Tom’s Hardware + Breaking Defense + TechCrunch + Bloomberg + winbuzzer + Washington Post 多源跨家验证
Anthropic ARR $30B：Yahoo Finance + PYMNTS + ARR Club + Bloomberg 多源
NVIDIA Vera Rubin：NVIDIA 官方 newsroom + Data Center Knowledge + CNN + Investor Relations 三源
Anthropic $900B 估值：CNBC 单源（未官宣，标记 confidence_flag）
Reflection AI 公司层：TechCrunch + Sequoia Capital + Tracxn + LinkedIn 多源
paper-digest 论文消费：直接读取 2026-05-04.json top_picks[]，未做二次 web 检索

coverage_gaps：

Reflection AI 自有模型卡 / 基准未公开
Anthropic $900B 估值仅 CNBC 单源未官宣
GPT-5.5-Cyber 具体能力 / 评测在 Nextgov 报道之外缺乏官方文档
paper-digest 今日 HF Daily metadata 缺 categories / affiliations，分类命中与新作者发现段被降级
S2 similar_papers 全部为空，论文层延伸阅读段空缺
今日订阅播客无更新（podcast_fetch.py 返回空）

Hanzhi's BLOG

[市场·2026-05-04] AI