[市场·2026-05-02] AI

AI 日报|2026-05-02

一句话结论:周五至周六(5/1-5/2)frontier 主线由四条线并行——五角大楼 5/1 与 7 家公司(OpenAI / Google / Microsoft / AWS / Nvidia / SpaceX / Reflection AI)正式签订 IL6/IL7 机密网络 AI 部署协议、Anthropic 因 Mythos 安全保留条款仍被排除(白宫在酝酿 executive action 重新接纳);Anthropic 在 4/29-30 启动 $900B+ 估值轮谈判(潜在 $50B 募资、目标 10 月 IPO),Counterpoint Q1 2026 LLM 收入份额 Anthropic 31.4% 首次超越 OpenAI 29%;今日 5/2 Lukilabs / craft.do 团队开源 Craft Agents(Apache 2.0)冲入 GitHub Trending,复旦 Yanghua Xiao 课题组上线 GenericAgent 论文(arxiv 2604.17091),Karpathy 4/29 Sequoia AI Ascent 宣告 “Agentic Engineering 时代到来”。

摘要

  • 政府采购重排:5/1 美国国防部首次将 AI 集中部署到机密网络(IL6 / IL7),7 家入选公司中 Reflection AI 是当日唯一非主流 AI 大厂;Anthropic 因 Mythos 安全保留条款仍处于黑名单,但 Pentagon CTO Emil Michael 5/1 公开承认 Mythos “is a separate national-security moment”,且 NSA Project Aether 已通过 Mythos 对微软全代码做自动 red team。Axios 5/1 报道白宫正在酝酿 executive action 同时处理"政府高级 AI 使用"与"Anthropic 复合"两条独立轴 CNN / Axios / SiliconANGLE
  • 资本层结构性反转:Anthropic 4/29 进入 $900B+ 估值募资谈判($50B 潜在轮 / 估值半年从 $61.5B → $183B → $380B → $900B),$30B 年化收入,10 月 IPO 窗口;同期 Counterpoint Q1 2026 LLM 收入数据显示 Anthropic 份额 31.4% 首次反超 OpenAI 29%。Mythos 是核心叙事载体 CNBC / TechCrunch / The Register
  • 模型层:DeepSeek V4-Pro / V4-Flash 4/27 完整 Technical Report(Hybrid Attention CSA + HCA、1M 上下文,V4-Pro 在 1M-token 仅占 V3.2 27% inference FLOP / 10% KV cache),开源第二(Intelligence Index 52);GPT-5.5 自 4/23 已铺开至 Plus/Pro/Business/Enterprise 与 Codex,Terminal-Bench 2.0 82.7% / SWE-Bench Pro 58.6%;Claude Mythos Preview 仍限定在 Project Glasswing 约 50 家伙伴白名单。
  • 芯片 / 算力:Vera Rubin NVL72 全量产,FP4 推理 50 PFLOPS(5×B200)、训练 35 PFLOPS(3.5×Blackwell),Jensen Huang GTC 2026 锁定 Blackwell+Rubin 至 2027 共 1 万亿美元订单储备;NVIDIA fiscal 2026 收入 +73.21%、Data Center 627 亿美金、Networking +263% YoY,5 月 20 日财报将复核 1T 故事。
  • OSS Agent 新一波:今日 5/2 Lukilabs / craft.do 团队开源 Craft Agents(Apache 2.0,github.com/lukilabs/craft-agents-oss)冲入 GitHub Trending,"Craft Agents 用 Craft Agents 自举开发"叙事强;Fudan Yanghua Xiao 课题组发布 GenericAgent 论文(arxiv 2604.17091):3K 行 seed 自演化技能树、6× 更少 token 实现完全本地系统控制;OpenClaw 已破 350,000 GitHub stars,全部领跑全 GitHub topic。
  • 能源:IEA 4/30 数据中心电力专题确认 2025 年耗电激增、瓶颈持续;SMR 与数据中心 conditional offtake 储备从 2024 年底 25 GW 升至 45 GW。
  • Agent 工程化:Karpathy 4/29 Sequoia AI Ascent 2026 fireside 公开宣告 “vibe coding 已被 Agentic Engineering 取代”,定义 Software 3.0 = prompt + context + agent + tool + memory + verification;Agentic AI 同步进入主流学术议程——James Evans 等 2026 年 Science 发文《Agentic AI and the next intelligence explosion》论证 frontier reasoning 模型自发涌现 “society of thought”。
  • 候选池:本日新增 3 名候选人——Bálint Orosz(Lukilabs / Craft 创始人,今日开源 Craft Agents OSS)、Yanghua Xiao 肖仰华(复旦教授,GenericAgent 论文资深作者)、James Evans(芝加哥大学社会学 / Knowledge Lab 主任,Science 论文一作)。

Frontier Labs / Frontier Model Radar

  • OpenAI:5/1 签订 Pentagon IL6/IL7 机密网络 AI 部署协议,OpenAI 官页同步挂出 “Our agreement with the Department of War”(前置条款:不得用于 US persons 国内监控、不得独立指挥需人类控制的自主武器) CNN / SiliconANGLE。GPT-5.5 4/23 全量铺开,Codex 现以 GPT-5.5 为底座,Terminal-Bench 2.0 82.7% / SWE-Bench Pro 58.6%。OpenAI 据报年化收入超 $250 亿(vs Anthropic $300 亿),但 Counterpoint Q1 2026 数据显示 OpenAI LLM 收入份额已被 Anthropic 31.4% 反超至 29% The Register
  • Anthropic:4/29 启动 $900B+ 估值募资谈判,潜在 $50B 单轮、$30B 年化收入、10 月 IPO 窗口,估值从 2025/3 $61.5B → 2025/9 $183B → 2026/2 $380B → 5 月 $900B+,9 个月翻 14 倍 CNBC / Bloomberg / TechCrunch。Mythos Preview 仍限定 Project Glasswing 约 50 家伙伴白名单(Apple / Google / Microsoft / Nvidia / Palo Alto / CrowdStrike / Cisco / JPMorgan / Linux Foundation 等);NSA Project Aether 已确认使用 Mythos 对 Microsoft 全代码做大规模 autonomous red team;Pentagon 5/1 仍未将 Anthropic 纳入 IL6/IL7 合同;白宫在酝酿 executive action 同时处理"政府高级 AI"与"Anthropic"两条轴 Axios
  • Google DeepMind:Deep Research / Deep Research Max 4/22 发布(Gemini 3.1 Pro 底座),Max 版本通过扩展 test-time compute 做迭代检索 + 推理 + 报告精修;Gemini 3.1 Ultra 提供 2M 上下文跨视频 / 音频 / 文本原生多模态推理;Demis Hassabis 4 月底 podcast 重申 “ChatGPT 将 AI 引偏方向”。本周作为 Pentagon IL6/IL7 7 家入选公司之一进入机密网络合同。
  • DeepSeek:V4 Technical Report 4/27 完整文档(V4-Pro 1.6T 参 49B 激活、V4-Flash 284B 参 13B 激活,Hybrid Attention = CSA + HCA,1M 上下文 V4-Pro 仅占 V3.2 27% inference FLOPs / 10% KV cache) DeepSeek 官页 / HF V4-Pro / API docs;本日 5/2 Hugging Face papers / GitHub trending 周末延烧。
  • Meta / Qwen / Mistral / xAI:Qwen3.6-35B-A3B(4/16)、Qwen3.6-27B(4/22)、Mistral Medium 3 / Large 3(4 月内开源)已陆续发布;Meta 据 4 月底 Techzine 报道正在准备其下一代 frontier model 的开源版本;xAI Grok 5 在 4/30-5/1 时间点仍无新一手信号(属 unverified frontier signal)。

关键人物与社区信号

  • Andrej Karpathy(ai-generalists, tracked):4/29 Sequoia AI Ascent 2026 fireside 宣告 “vibe coding”(其 2025/02 提出)已被 Agentic Engineering 取代;定义 Software 3.0 = prompt + context + agent + tool + memory + verification;2025/12 是个人 ratio 反转点(80/20 → 20/80,人 / Agent);frontier 模型仍是 “jagged entities”(能 refactor 代码却无法推理走去洗车)—— RL 奖励集中在 verifiable 输出(数学 / 代码)才是 jagged 的根源;spec / plan 是新 code The AI Opportunities / Analytics Drift
  • Sam Altman / Greg Brockman(openai-builders, tracked):5/1 Pentagon 合同日 OpenAI 官页同步发布合同声明,二人本日均在 X 上转发并强调"前置 guardrail 完全保留"。
  • Dario Amodei(公司 CEO,未入跟踪池):4/17 白宫闭门会落地于 5/1 Pentagon 仍未给单;Pentagon CTO Emil Michael 5/1 公开"Mythos is another matter"。资本面($900B 谈判)与政府面(Glasswing 受限)双重解耦。
  • Misha Laskin / Ioannis Antonoglou(Reflection AI,已纳入候选池):5/1 进入 Pentagon IL6/IL7,是 7 家公司中唯一非主流 AI 大厂;继续巩固 “America’s open frontier” 路线 SiliconANGLE
  • Yu Su 苏煜(已纳入候选池):5/1 张小珺《Agent 综述》节目嘉宾,复盘 Logical Agent → Neural Agent → Semantic Parsing → Language Agent 四阶段技术史 小宇宙
  • Bálint Orosz(候选):Lukilabs / Craft Docs CEO & Founder(前 Skyscanner Head of Product, Apps;前 Distinction 创始人,被 Skyscanner 收购),今日 5/2 通过 craft.do 博客《Introducing Craft Agents — The Open Source Agent Interface》宣告把内部"Craft Agents 用 Craft Agents 开发"的 agent 开发栈以 Apache 2.0 开源 Craft 官博 / GitHub / AIToolly 报道
  • Yanghua Xiao 肖仰华(候选):复旦大学计算机学院教授(GDM@Fudan / KW@Fudan 主任),9,600+ Google Scholar 引用;GenericAgent 论文 4/30 上 arxiv(2604.17091),“Token-Efficient Self-Evolving LLM Agent via Contextual Information Density Maximization”,3K 行 seed 自演化技能树、9 atomic tools + 100 行 Agent Loop 可控全本地系统 arxiv / HF Papers / GitHub lsdefine/GenericAgent
  • James Evans(候选):芝加哥大学社会学讲席教授 / Knowledge Lab 主任,2026 年 Science 论文《Agentic AI and the next intelligence explosion》第一作者,证明 frontier reasoning 模型(DeepSeek-R1 / QwQ-32B)在 RL 仅奖励正确性时自发涌现"society of thought"——内部多视角辩论行为,把 Agentic AI 的多智能体讨论升格为 frontier reasoning 模型的"内生属性" Science DOI

Energy

  • IEA 4/30 数据中心电力专题确认 2025 年数据中心耗电激增,瓶颈在区域级输配电与水冷循环;2026 年 conditional offtake 议价权进一步向运营商倾斜。
  • SMR 与数据中心运营商 conditional offtake 储备从 2024 年底 25 GW 升至 45 GW;2026 年内 NRC 将就首批两个商用 SMR 建造许可下达裁决;中国海南玲龙一号(Linglong One)按计划 2026 上半年商用;美国 Three Mile Island 复产从 2028 提前至 2027。
  • 周末(5/1-5/2)能源主线无新增一手公开信号——no high-confidence incremental signal,下一个观察点是 5 月初 IEA / EIA 月度更新与首批 NRC 反馈窗口。

Chips

  • NVIDIA Vera Rubin NVL72:已进入全量产,FP4 推理 50 PFLOPS(5×B200)、训练 35 PFLOPS(3.5×Blackwell),AWS / Google Cloud / Azure / OCI / CoreWeave / Lambda / Nebius / Nscale 列为首批 deploy;Jensen Huang GTC 2026 路演锁定 Blackwell+Rubin 至 2027 1 万亿美元订单储备(vs 上一年 5,000 亿口径) CNBC GTC / TechCrunch / Data Center Knowledge;5 月 20 日 NVIDIA 财报将复核 1T 故事。
  • TSMC fiscal 2026 +35.1% YoY;Vera Rubin 1.3M 部件、10× 性能 / 瓦提升于 Blackwell 是单芯片代际跳代核心。
  • Networking +263% YoY(NVLink Switch + InfiniBand + Spectrum-X)说明云厂商部署口径已从单卡转为整柜级互联率定价。

Infra

  • Pentagon IL6/IL7:5/1 7 家公司(OpenAI / Google / Microsoft / AWS / Nvidia / SpaceX / Reflection AI)正式签约,机密网络 AI 部署进入 procurement 落地期。
  • OSS Agent 新一波
    • Lukilabs Craft Agents OSS(5/2 today,Apache 2.0):craft.do 团队把内部 agent 开发栈整体开源,已冲 GitHub Trending;"Craft Agents 用 Craft Agents 开发"的自举叙事强 Craft 官博
    • Fudan GenericAgent(4/30 paper / 5/2 trending):3K 行 seed 自演化技能树、9 atomic tools + 100 行 Agent Loop、6× 更少 token 实现 browser/terminal/filesystem/键鼠/视觉/ADB 全控制 arxiv 2604.17091
    • OpenClaw 已破 350,000 GitHub stars;Hermes Agent 周新增持续走高。
  • infra benchmark 模式:Counterpoint 把 LLM 收入分账作为 infra 层 KPI,把"模型 token 出口"等同于"infra 出口",是 2026 行业测算口径变化的关键。

Model

  • DeepSeek V4 Technical Report(4/27):Hybrid Attention = CSA(Compressed Self-Attention)+ HCA(Hierarchical Cross-Attention),1M 上下文 V4-Pro 仅占 V3.2 27% inference FLOPs / 10% KV cache;V4-Pro 1.6T 参 49B 激活、V4-Flash 284B 参 13B 激活;Artificial Analysis Intelligence Index 52(开源第二)。
  • GPT-5.5(4/23 全量):Codex 接管,Terminal-Bench 2.0 82.7% / SWE-Bench Pro 58.6%,是当前 agentic coding SOTA;ChatGPT Plus / Pro / Business / Enterprise 全量。
  • Claude Mythos Preview:限定 Project Glasswing 约 50 家伙伴;累计 zero-day “数千”,含 OpenBSD 27 年陈旧漏洞、FreeBSD CVE-2026-4747 17 年 NFS RCE。
  • Gemini 3.1 Pro / Ultra + Deep Research Max(4/22):2M 上下文原生多模态、Max 版本扩展 test-time compute。
  • Qwen3.6-35B-A3B / 3.6-27B / Mistral Medium 3 / Large 3:4 月内累计开源七款新模型。
  • GLM-4.7(智谱):完全用华为昇腾训练、1.2% 幻觉率、$0.11/1M 输入 token,是中国国产闭环最完整代际 llm-stats

Application

  • Pentagon IL6/IL7 将 frontier 模型推到机密网络的"大模型为 OS"应用层。
  • Coding agent:Codex on GPT-5.5 + Cursor / Cline / Claude Code 周末持续增量;Karpathy 公开把 spec / plan 视为新 code、把 verifier 视为奖励信号源。
  • Agent OS:Lukilabs Craft Agents OSS 与 Fudan GenericAgent 的共同主题——把 agent 从"应用内插件"上推到"用户级操作 OS"层,3K-line / 100-line Agent Loop 范式说明 application 层正经历"小核心 + 大技能树"的范式压缩。
  • Robotics:Physical Intelligence π0 / π0.6 持续接近通用机器人部署,Karol Hausman / Sergey Levine / Chelsea Finn 路线进入 deploy 周期 Generalist
  • Knowledge work / Browser agent:Browser-Use / Operator / Browserbase / OpenClaw 处于"控制平面竞速"。

层间联动影响

  • Capital ↔ Government:Anthropic $900B 谈判 + Counterpoint 31.4% 收入领先 + Pentagon 黑名单 + 白宫 executive action 酝酿——四件事同时发生,说明资本市场已把"白宫 → Pentagon 接纳路径"折现为接近 OpenAI 的估值上限;如 5 月内 executive action 落地,估值上限可能继续上抬。
  • Chips ↔ Capital:NVIDIA 1T 订单储备 + 5/20 财报构成下一个 chips ↔ capital 复核窗口,Vera Rubin 量产是 Blackwell 之后第一个真正切换代际节点。
  • Model ↔ Application:DeepSeek V4 把 1M 上下文成本拉到 V3.2 27%,直接给 OpenClaw / Cursor / Codex 一类 long-context agent 把 token 经济学扳到可商用区间;GPT-5.5 + Mythos + V4 三家形成"frontier coding 三极"。
  • Infra ↔ Model:Lukilabs Craft Agents + Fudan GenericAgent 把 agent runtime 从框架(LangChain / LlamaIndex / AutoGen)下沉为 OS-level skill tree(3K-line seed),为 infra 层"agent control plane vs. agent skill plane"提供新分层。
  • Energy ↔ Chips:Vera Rubin 10× 性能 / 瓦虽缓解了单 GPU 能效,但 1T 订单意味着区域级输配电与冷却仍是 SMR 储备 45 GW 的核心驱动;energy ↔ chips 仍是结构性不平衡。

🎙️ 播客动态

候选池变化与后续关注

  • 本日新增候选 3 名
    • balint-orosz(Bálint Orosz,Lukilabs / Craft Docs CEO & Founder)— 今日 5/2 开源 Craft Agents OSS(Apache 2.0),冲 GitHub Trending;前 Skyscanner Head of Product, Apps;group: oss-ai-builders
    • yanghua-xiao(Yanghua Xiao 肖仰华,复旦大学计算机系教授 / GDM@Fudan & KW@Fudan 主任)— GenericAgent 论文(arxiv 2604.17091)资深作者,3K 行 seed 自演化技能树研究路线;group: oss-ai-builders
    • james-evans(James Evans,芝加哥大学社会学讲席教授 / Knowledge Lab 主任)— Science 2026《Agentic AI and the next intelligence explosion》一作,证明 frontier reasoning 模型自发涌现 “society of thought”;group: ai-generalists
  • 持续观察候选:Misha Laskin / Ioannis Antonoglou(Reflection AI,已入 pending_seed_sync 4/26-5/1)、Yu Su(已入 pending_seed_sync 5/1)、Lianmin Zheng(LMSYS / SGLang,已入候选池 4/26)。
  • 晋升候选评估:当前候选池已 26 名(外加 10 名 pending_seed_sync),下一周(5/3-5/9)若其中任一在 frontier 主线上有第二次独立信号(如 Misha Laskin 完成 Pentagon Phase 2、Yu Su NeoCognition 公开第一款 product、Lianmin Zheng SGLang 进入 V4 第二次基准更新),即可考虑晋升。
  • 后续关注 4 条
    1. 白宫 executive action 是否在 5 月内落地,Anthropic Glasswing 名单是否解除约束;
    2. NVIDIA 5/20 财报是否复核 1T Blackwell+Rubin 订单储备真实进度;
    3. Lukilabs Craft Agents OSS 7 天 stars / contributors 曲线,验证是否真为新一波 OSS Agent 拐点;
    4. Yanghua Xiao GenericAgent 论文是否在 5/3-5/9 周内出现第三方独立 SWE-Bench / OS-Bench 复现。

来源与交叉验证说明

  • 本日报告以 CNN / CNBC / Bloomberg / TechCrunch / Axios / SiliconANGLE / The Register(media / analysis)+ OpenAI 官页 / Craft.do 官博 / DeepSeek 官页 / Hugging Face / arxiv(primary / official + company / filing)为主线;Counterpoint 数据 + IEA 报告(primary research)为基准;张小珺《商业访谈录》小宇宙节目(community / social)作为播客一手;Sequoia / The AI Opportunities / Analytics Drift 复盘 Karpathy 演讲(media / analysis + community / social 三方互证)。
  • Pentagon 5/1 合同:CNN + SiliconANGLE + Tom’s Hardware + OpenAI 官页 + Axios 五源交叉。
  • Anthropic $900B:CNBC + Bloomberg + TechCrunch + The Next Web + Tech Startups + Yahoo Finance 六源交叉,均指向 4/29-30 启动 / 2 周内可能落地。
  • Counterpoint Q1 2026 31.4% vs 29%:The Register 4/30 一手报道,需 5 月内 Counterpoint 原报告全文确认。
  • DeepSeek V4 Technical Report 4/27:DeepSeek 官页 + HF V4-Pro + API docs + Artificial Analysis 四源交叉。
  • Lukilabs Craft Agents OSS 5/2:GitHub repo + Craft.do 官博 + AIToolly + DeepWiki + Releases 五源交叉,确认 5/2 Apache 2.0 上线。
  • GenericAgent paper 2604.17091:arxiv 主页 + HF Papers + GitHub lsdefine + Cool Papers + Mervin Praison 五源交叉,作者归属 Fudan Yanghua Xiao 等。
  • James Evans Science 2026:Science 直接 DOI 一手;本日仅一源主线,需后续 nature / arxiv preprint 互证(confidence_flag: single-source-mainline)。
  • Karpathy Sequoia AI Ascent 2026:The AI Opportunities + Analytics Drift + Dealroom 三方复盘交叉。
  • NVIDIA 1T 订单 / Vera Rubin:CNBC GTC + TechCrunch + Data Center Knowledge + Motley Fool + Tikr 五源交叉,5/20 财报复核窗口。
  • 本日播客:podcast_fetch.py 5/2 抓取张小珺单一一集(5/1 上线)。