AI 日报|2026-05-04
一句话结论:5/1–5/4 frontier 主线被「Pentagon IL6/IL7 八厂家协议」与「Anthropic $30B ARR / $900B 估值新一轮谈判」两条线主导——OpenAI / Google / Microsoft / Amazon / Oracle / NVIDIA / SpaceX / Reflection AI 同批进入分类网络(Anthropic 因军用安全护栏被显式排除,OpenAI 同步推 GPT-5.5-Cyber 抢占国防安全应用),叠加 NVIDIA Vera Rubin 全量生产、Q1 全球 VC $300B AI 占 80%、PJM 60 GW 电力缺口承压、Mistral Medium 3.5 出货等多重事件,构成 chips→infra→model→application→energy 全链条同向放量的「结构性重组日」。
摘要
本日 4 个子章节(frontier_radar / paper_layer / people_pool / macro_news)信号集中在四条线:(1) Pentagon 5/1 IL6/IL7 协议把 8 家厂商纳入分类网络,Reflection AI 与七巨头同级,Anthropic 被显式排除;(2) Anthropic ARR $30B + 1000+ $1M+/年企业客户里程碑,叠加 $900B 估值传闻;(3) NVIDIA Vera Rubin 全量生产 + OpenAI 10 GW Vera Rubin 投产,把 chips→infra→model 串成同一资本结构;(4) paper-digest 今日 19 篇候选被 Agent / Multi-Agent 主线压制,Web2BigTable / OSCAR / Stable-GFlowNet 给 deep-research / VLM 校准 / red-teaming 各自设了新基线。社区端 Karpathy「LLM as knowledge compiler」范式转向、Simon Willison 4 月密集事实核对、Sebastian Raschka × Nathan Lambert 4.5h Lex Fridman 长访谈是本周最高密度的 OSS / 评论员信号。
Frontier Labs / Frontier Model Radar
5/1–5/4 frontier 主线被 Pentagon IL6/IL7 七厂家协议(OpenAI / Google / Microsoft / Amazon / Oracle / NVIDIA / SpaceX / Reflection AI 入选,Anthropic 因军用安全护栏被排除)与 Anthropic $30B ARR / $900B 估值新一轮谈判主导。OpenAI 同步推出 GPT-5.5-Cyber + Cybersecurity Action Plan,Mistral 4/29 上架 Medium 3.5;DeepSeek V4 / Qwen 3.5 / Gemma 4 主线本周无新版本,进入消化期。Reflection AI 借 DeepMind 系背景拿到与七大同级 IL6/IL7 资格,是本周 frontier watchlist 内首次出现的「准 frontier」厂家。
OpenAI
- Pentagon IL6/IL7 入选 + GPT-5.5-Cyber 出货(5/1–5/4):与 Google、Microsoft、Amazon、Oracle、NVIDIA、SpaceX、Reflection AI 同批进入分类网络,部署在 GenAi.mil 平台供 130 万国防人员调用;同期发布 GPT-5.5-Cyber 与 Cybersecurity Action Plan。(CNN / Nextgov / Breaking Defense)
Anthropic
- $30B ARR 公布同周被 Pentagon 排除(5/1–5/3):ARR 突破 $30B(5 个月内 $9B→$30B),$1M+/年企业客户从 ~500 翻至 1000+;同时被 Pentagon 显式拉出 IL6/IL7 名单(拒绝放开军用通用条款),Mythos / Project Glasswing 已扫出数千枚漏洞但未改变国防部立场。(Yahoo Finance / PYMNTS / CNN)
- $900B 估值新一轮融资讨论曝光(4/29):CNBC 披露 Anthropic 与投资人初谈估值 $900B,超越 OpenAI 当前估值。(CNBC)
Google DeepMind
- Pentagon IL6/IL7 入选 + Deep Research Max 已落地(4/22 + 5/1–5/4):与 OpenAI / Microsoft / Amazon 同批拿到分类网络资格;Gemini 3.1 Pro 驱动的 Deep Research Max 4/22 上线,针对长程研究 workflow,含 MCP 支持与原生可视化。(CNN / Google Blog / SiliconANGLE)
Meta
- 本周无 frontier 模型新动作;存量战略卡位仍是 Vistra / TerraPower / Oklo / Constellation 共 ~6.6 GW 核电承诺,PJM 区 1.2 GW 校园 2030 上线。(Meta)
xAI
- Grok 3 开源时间窗(Musk 2 月承诺)已过,权重仍未公开;本周无主线动作。
Mistral
- 4/29 发布 Mistral Medium 3.5,本周开源端唯一 frontier 主线新版本。(Codersera)
Qwen
- 本周无 frontier 新版本;Qwen 3.5 主线 3 月已铺完。
DeepSeek
- 本周无 frontier 新版本;4/24 V4 Pro / V4 Flash 之后进入消化期。
未验证 frontier 信号
- Reflection AI 与 OpenAI / Google / Microsoft / Amazon / NVIDIA / SpaceX 同批入选 Pentagon IL6/IL7,但其至今未公开发布商业 LLM;TechCrunch 报道目标为「数十万亿 token 训练的语言模型」,模型卡 / 基准未公开。该入选属 Pentagon 对「frontier 候选厂家」的押注,而非对已发布模型的认可。(TechCrunch / winbuzzer)
关键人物与社区信号
5/1–5/4 tracked-pool 主要由 Anthropic / OpenAI 高管表态和 OSS 社区评论员消化 4 月一轮 frontier 主线推动。Karpathy 4/3 宣布把主要 token 流量从写代码转向 LLM 自维护 wiki(知识编译器范式);Simon Willison 整月密集覆盖 DeepSeek V4 / GPT-5.5 / Claude 4.7 / Project Glasswing / Mythos,是 OSS 端跨厂家事实核对中枢。Brockman 4/3 起接管 OpenAI 产品组(Fidji Simo POTS 复发休假),Sam Altman 4 月仍未给 GPT-6 公开窗口。
- Andrej Karpathy(4/3, X):「a large fraction of my recent token throughput is going less into manipulating code, and more into manipulating knowledge」,发布个人 wiki 范式(100 篇文章 / 40 万字,由 LLM 自维护)。(Medium 复盘)
- Simon Willison(4/7, 4/14, 4/18, 4/22, 4/23, 4/24, 4/27):整月密集发文:Project Glasswing 限制 Mythos → GPT-5.4-Cyber 框架 → Claude Opus 4.6→4.7 system prompt diff → Claude Code $100/月辨析 → GPT-5.5 pelican 测试 → DeepSeek V4 上手 → Microsoft-OpenAI AGI 条款消亡考。
- Sam Altman(4 月持续):3/24 公布 Spud 模型预训练完成、「几周后发布」;4/23 该模型最终以 GPT-5.5 名义出货(仍属 GPT-5 家族),GPT-6 公开窗口本月未给出。(felloai 时间线)
- Greg Brockman(4/3 起):Fidji Simo POTS 复发开始医疗休假,OpenAI 产品组改由 Brockman 接管;Jason Kwon / Sarah Friar / Denise Dresser 分担业务/运营。(Fortune / Bloomberg)
- Sebastian Raschka × Nathan Lambert(Lex Fridman #490):4.5 小时 State of AI 2026 长访谈,覆盖中国开源、coding agent、scaling、agents、GPU、AGI;提出「AI 在日常生活影响层面可能进入 plateau」的非共识判断。(sebastianraschka.com)
Energy
- Meta 已与 Vistra / TerraPower / Oklo / Constellation 签约,合计承诺 ~6.6 GW 核电;PJM 区 1.2 GW 校园 2030 上线,是 frontier-lab 在能源端最深的卡位。(Meta)
- PJM 4/29 重启电源接入流程,811 个新发电项目排队申请并网;其中 Commonwealth Fusion Systems 申请在维州建首座核聚变电厂(早期 2030s 投运)。(Inquirer)
- PJM 警示 2027 年起最多 60 GW 供应缺口可能导致区域停电;2026 hyperscalers 计划数据中心 capex ~$700B。(Belfer Center)
Chips
- NVIDIA Vera Rubin 平台进入全量生产(CES 2026 公布的 7 颗新芯片,含首次集成 Groq 3 LPU);H2 2026 落地 AWS / GCP / Azure / OCI 与 CoreWeave / Lambda / Nebius / Nscale。NVIDIA 估计 Rubin 运行成本是 Blackwell 的 1/10。(NVIDIA Newsroom / Data Center Knowledge)
- OpenAI × NVIDIA 战略协议:H2 2026 落地首批 1 GW Vera Rubin 系统,每部署 1 GW 触发 NVIDIA 累进投资,最高 $100B。(NVIDIA Newsroom)
- Pentagon 5/1–5/4 IL6/IL7 协议把 NVIDIA 与 OpenAI / Google / Microsoft / Amazon / Oracle / SpaceX / Reflection AI 同批纳入分类网络。(CNN)
Infra
- Pentagon 5/1–5/4 IL6/IL7 协议是本周最大 infra 主线:8 家厂商进入分类网络(OpenAI / Google / Microsoft / Amazon / Oracle / NVIDIA / SpaceX / Reflection AI),通过 GenAi.mil 平台对 130 万国防人员开放。「防 AI 厂商锁定」是国防部明示的架构原则。(Tom’s Hardware / Breaking Defense)
- Anthropic × Google × Broadcom 三方算力扩盘:Anthropic 拿到约 3.5 GW 算力承诺(含 TPU + Broadcom 定制硅);与 4/24 Google 宣布 $40B 投资 Anthropic(首期 $10B / $35B 估值 / 5GW 算力)一脉相承。(Anthropic / Bloomberg)
- Q1 2026 全球风险投资创纪录 ~$300B,AI 占 80%($242B);AI 基础设施类 25 笔披露融资合计 $10.64B(中位 $200M)。(Crunchbase)
Model
- Anthropic:ARR 突破 $30B,$1M+/年客户 1000+;同周被 Pentagon 显式排除 IL6/IL7。新一轮估值 $900B(CNBC 单源);Claude Opus 4.7 4/16 GA。(PYMNTS / CNBC / GitHub Changelog)
- OpenAI:4/23 GPT-5.5 发布(SWE-bench Pro 58.6% / Terminal-Bench 2.0 SOTA 82.7%);4 月底推出 GPT-5.5-Cyber + Cybersecurity Action Plan;Spud 即 GPT-5.5,仍属 GPT-5 家族。(Nextgov / felloai)
- Mistral 4/29 上架 Medium 3.5。(Codersera)
来自 paper-digest 的论文
- 2604.24026 From Skill Text to Skill Structure: The Scheduling-Structural-Logical Representation for Agent Skills — 结构化技能表征让 Agent 技能可检索可复用。
- 2604.27221 Web2BigTable: A Bi-Level Multi-Agent LLM System for Internet-Scale Information Search and Extraction — 双层多智能体框架做互联网级搜索抽取,WideSearch 38.50 / XBench-DeepSearch 73.0 SOTA。
- 2605.00323 Online Self-Calibration Against Hallucination in Vision-Language Models — MCTS+DPO 在线校准 VLM 幻觉。
- 2605.00691 Learning to Act and Cooperate for Distributed Black-Box Consensus Optimization — LLM 引导的去中心化协同优化框架。
- 2605.00414 Trees to Flows and Back: Unifying Decision Trees and Diffusion Models — 建立决策树与扩散模型的数学统一。
- 2605.00553 Stable-GFlowNet: Toward Diverse and Robust LLM Red-Teaming via Contrastive Trajectory Balance — 去 Z 估计的稳定 GFlowNet 红队训练。
Application
- Microsoft Agent Framework 1.0(4/3 GA):production-ready OSS,支持 .NET / Python,原生集成 MCP,含 Magentic-One 多 agent 编排;与 LangGraph / CrewAI 形成主流 agent 框架三角。(Microsoft)
- Lukilabs Craft Agents(5/2,Apache-2.0)发布。(AIToolly)
- Claude Code 5 月更新:智能 model 选择、project purge、ANTHROPIC_BEDROCK_SERVICE_TIER 环境变量、PR URL→/resume session 索引。(Claude Help)
- Pentagon × GenAi.mil:8 家厂商分类网络部署直接面向 130 万国防人员,已构建数十万 AI agent。(Breaking Defense)
不在 paper-digest 内的技术信号
- Lukilabs Craft Agents 5/2 在 Apache-2.0 下发布(同上 application 项)。
- Karpathy nanochat 4/16 沙箱逃逸 CVE 公开(CVSS 9.8),影响全部当前版本
execution.py。(nanoGPT issue 717)
来自 paper-digest 的论文(application 子层)
- 2604.23195 AnalogRetriever: Learning Cross-Modal Representations for Analog Circuit Retrieval — 三模态检索框架提升模拟电路搜索通过率。
- 2605.00416 Learning while Deploying: Fleet-Scale Reinforcement Learning for Generalist Robot Policies — 集群部署边训练通用机器人策略 95% 成功。
层间联动影响
- NVIDIA Vera Rubin(chips)→ Pentagon IL6/IL7 + OpenAI 10 GW(infra):H2 2026 首批 1 GW OpenAI Vera Rubin 系统投产,与 5/1 Pentagon 协议同期落地;NVIDIA 累进投资 OpenAI 最高 $100B 把 chips→infra→model 三层串成同一资本结构。
- PJM 60 GW 缺口(energy)→ 5/1 Pentagon 8 家 + hyperscalers $700B 数据中心 capex(infra):能源缺口 + infra 资本同时放大,给 Meta / Oklo / Constellation 等核电卡位提供「能源即基础设施竞争力」的具体落地点。
- Anthropic Mythos 安全护栏(model)→ Pentagon 排除(infra)vs OpenAI GPT-5.5-Cyber 入选(model+application):模型层的安全姿态直接转化为 infra/application 层的市场份额分化。
- Reflection AI Pentagon 资格(model+infra):未公开发布商业 LLM 即获 IL6/IL7,Pentagon 在 frontier-startup 上做了与 NVIDIA $2B 同方向的押注;chips → 创业层 model 资本传导链条形成。
- Web2BigTable 学术 SOTA(model)→ Google Deep Research Max + OpenAI Deep Research(application):开源/学术给 deep-research agent 设了第一条公开 SOTA 基线(WideSearch 38.50 / XBench 73.0)。
🎙️ 播客动态
今日订阅播客暂无更新。
候选池变化与后续关注
本日发现扫描产出 2 名达标候选人,全部由 Pentagon 5/1–5/4 IL6/IL7 入选事件触发:
- Misha Laskin(Reflection AI 联合创始人 / CEO)(建议归入
ai-generalists):Reflection AI 与 OpenAI / Google / Microsoft / Amazon / NVIDIA / SpaceX / Oracle 同批入选 Pentagon IL6/IL7,是七巨头之外唯一被同级纳入的初创;NVIDIA 领投 $2.13B 已落地,洽谈中下一轮 $25B 估值;Laskin 此前在 DeepMind Gemini 主导 reward modeling。(CNN / TechCrunch / Sequoia Capital) - Ioannis Antonoglou(Reflection AI 联合创始人 / CTO)(建议归入
ai-generalists):AlphaGo / AlphaZero / Gemini RL 共同作者;与 Laskin 一道因 Reflection AI Pentagon 资格进入主流视野。(LinkedIn / Sequoia Capital)
促进项 promoted_people 本日为空。candidate_queue_summary:建议下次跑加入这 2 位入跟踪池后,单独建 frontier-startup-builders 分组(如有 Ineffable Intelligence David Silver / Mira Murati Thinking Machines 等同期候选可一并归入)。
来源与交叉验证说明
源类型混合:
- primary / official:OpenAI / Anthropic / Microsoft / NVIDIA / Meta / DeepSeek / Anthropic.com 公司公告与 changelog
- company / filing:GitHub Release Notes、Anthropic 官方融资公告
- media / analysis:CNBC / CNN / Bloomberg / TechCrunch / Tom’s Hardware / Fortune / Reuters / Inquirer / Breaking Defense / Nextgov / Tom’s Hardware / VentureBeat / Yahoo Finance / PYMNTS
- community / social:Simon Willison 博客(密集 4 月覆盖)、Sequoia Capital 创始人介绍页、Lex Fridman Podcast、Sebastian Raschka 博客、Andrej Karpathy X 主页、AIToolly OSS 公告
验证记录:
- Pentagon IL6/IL7 协议:CNN + Tom’s Hardware + Breaking Defense + TechCrunch + Bloomberg + winbuzzer + Washington Post 多源跨家验证
- Anthropic ARR $30B:Yahoo Finance + PYMNTS + ARR Club + Bloomberg 多源
- NVIDIA Vera Rubin:NVIDIA 官方 newsroom + Data Center Knowledge + CNN + Investor Relations 三源
- Anthropic $900B 估值:CNBC 单源(未官宣,标记 confidence_flag)
- Reflection AI 公司层:TechCrunch + Sequoia Capital + Tracxn + LinkedIn 多源
- paper-digest 论文消费:直接读取 2026-05-04.json
top_picks[],未做二次 web 检索
coverage_gaps:
- Reflection AI 自有模型卡 / 基准未公开
- Anthropic $900B 估值仅 CNBC 单源未官宣
- GPT-5.5-Cyber 具体能力 / 评测在 Nextgov 报道之外缺乏官方文档
- paper-digest 今日 HF Daily metadata 缺 categories / affiliations,分类命中与新作者发现段被降级
- S2 similar_papers 全部为空,论文层延伸阅读段空缺
- 今日订阅播客无更新(podcast_fetch.py 返回空)