AI 日报|2026-05-22
一句话结论:5/20-5/22 一条「算力放量 → capex/网络 → 电力争夺」的传导链在芯片/基建/能源三层同时显形——NVIDIA Q1 FY27 创纪录 $81.6B(+85%) 却对 Q2 指引「零中国数据中心收入」,把全球算力切成两套体系;前沿层则全面转向 agent 平台化(Qwen3.7-Max 云栖发布、Anthropic Code with Claude London『Dreaming』、Gemini 3.5 Flash/Omni),通用前沿大模型进入相对空窗,价值创造前沿从「发新模型」移向「把代理嵌进企业工作流变现」。
摘要
本窗口主线有二。其一是算力—资本—电力传导链:NVIDIA Q1 FY27(5/20 盘后)营收创纪录 $81.6B(+85%)、数据中心 $75.2B(+92%)、网络 $14.8B(+199%),追加 $80B 回购、股息约升 25 倍;但 Q2 指引 $91B 明确「不假设来自中国的任何数据中心收入」,黄仁勋承认让位本土——叠加 BIS 放行 H200 却零发货,出口管制把全球算力切成两套体系。算力放量推高四大约 $725B(+77%) 的 2026 capex与网络互联占比,又把电力变成终极瓶颈,催生 NextEra $67B 收购 Dominion 与在地燃气发电激增。其二是 agent 平台化全面加压:Qwen3.7-Max 云栖发布、Anthropic Code with Claude London、Gemini 3.5 Flash/Omni 同窗推进,论文层 KV cache 从压缩/安全共享/稀疏化三面被攻成为系统层争夺焦点。
Frontier Labs / Frontier Model Radar
2026-05-20 至 05-22 的 48 小时内,前沿信号集中在智能体平台化与中国实验室旗舰追赶。
- Anthropic(verified):Code with Claude 伦敦站(5/19-5/21,继 5/6 旧金山站)聚焦 agent 基础设施:可在企业自有设施运行 agent 的自托管沙箱、让 agent 不经公网触达内部系统的 MCP tunnel、以及 Claude Code 的 『Dreaming』(agent 给自己写笔记、留存任务经验供后续 agent 复用,demo 自动生成
descent-playbook.md)。会上未发布新旗舰模型。来源:Fortune。 - Qwen(verified):阿里在 5/20 云栖大会正式发布面向 agent 时代的旗舰 Qwen3.7-Max(5/14 现身 LM Arena、5/19 上线阿里云 API):主打长时序任务(号称可自主运行约 35 小时)、编码调试与办公自动化;闭源 preview、含 1M token 上下文与扩展思考模式,尚无开源权重;AA Intelligence Index 56.6 排名 #5。本窗口中国侧最强追赶信号。
- Google DeepMind(verified,窗口边缘):Google I/O 2026(5/19-5/20)推 Gemini 3.5 Flash(成本不到同级一半,约 $1.5/M in、$9/M out)+ any-to-any Gemini Omni;Ultra 订阅 $250→$200/月,新增 $100/月开发者档。
- OpenAI(verified,次要):5/20 发布内容溯源(content provenance)研究;Codex 企业化推进(5/19 与 Dell 合作 on-prem/混合云、5/20-5/21 终端 alpha 迭代)。
- Meta / xAI / Mistral / DeepSeek:本 48h 窗口无新增高置信信号(见 coverage_gaps)。
未核实信号:DeepSeek R2 推理模型仍未正式发布——截至 5/7 官方 API 仅含 deepseek-v4-flash / deepseek-v4-pro,R2 加速发布说法源自更早媒体报道,本窗口无官方确认(来源)。不作为本日主线。
关键人物与社区信号
- Boris Cherny(Anthropic / Claude Code) — 5/19 伦敦 Code with Claude 主会场登台,发布 Claude Managed Agents 三能力:multi-agent orchestration、Outcomes(定义成功标准让 Claude 自迭代)、『Dreaming』(隔夜复盘历史 session 写入新记忆)。来源:Fortune、MIT Tech Review、Simon Willison live blog。
- Andrej Karpathy(generalist) — autoresearch loop 范式快速扩散:Shopify 的 Tobi Lütke 用
pi-autoresearch跑出 ThemeRunner 53% 提速,但 PR 未合并且被标记为 overfit/存疑;公开为 Simon Willison 博客 23 周年背书。来源:TechTimes、X/@karpathy。 - Simon Willison(OSS) — newsletter『Agentic Engineering Patterns』+ Code w/ Claude live blog,贴身记录 Shopify autoresearch 案例,本轮 agent 编码工作流叙事主要社区记录者之一。
Energy
- NextEra Energy 5/18 宣布以约 $67B 收购弗吉尼亚 Dominion,组建全美最大公用事业公司,明确意图是抢占 AI 数据中心电力需求激增——把「电力供给」整合为战略资产的最新结构性信号。
- 在地(behind-the-meter)燃气/自备发电继续成为绕开电网排队的主路径:Meta、xAI 等竞相启用现场发电机,全球在建燃气电厂规模已超 1000GW(约 +31% YoY),燃气轮机供不应求、价格预计较 2019 年涨约 195%——电力瓶颈从「电网容量」前移到「设备与燃气供给」。来源:Tom’s Hardware、TechCrunch。
coverage gap:5/20-5/22 窗口内未见全新 SMR/PPA 单一签约,能源层硬增量主要落在 5/18 NextEra-Dominion 并购与持续的燃气建设趋势。
Chips
- NVIDIA Q1 FY27(5/20 盘后):总营收 $81.6B(+85%)、数据中心 $75.2B(+92%)(计算 $60.4B、网络 $14.8B/+199%),Blackwell 300 放量主驱动;追加 $80B 回购、季度股息提升约 25 倍。
- Q2 FY27 指引约 $91B(±2%),明确「不假设来自中国的任何数据中心计算收入」;BIS 此前放行约 10 家中企(阿里/腾讯/字节/京东/联想/富士康,单家上限 7.5 万颗)采购 H200,但截至 5 月中无一颗实际发货——出口松绑与实物出货的鸿沟仍在。
- TSMC 先进封装扩产并刷新良率:5.5 倍光罩 CoWoS 良率已超 98%,目标 2026 年底 CoWoS 月产能冲至约 13 万片(较 2024 年底约 3.5 万片大幅放大);Rubin 平台将首次在 N3P 集成 HBM4。CoWoS/HBM 仍是 AI 算力关键节流阀。
Infra
- 四大(MSFT/Google/Amazon/Meta)2026 capex 共识维持约 $725B(+77% YoY):微软 $190B、Amazon 约 $200B、Google $175-185B、Meta $60-65B;内存芯片涨价正推高微软与 Meta 的支出预测。Anthropic 与 Google Cloud 的五年 $200B、5GW 容量承诺显示算力承购正以「GW + 千亿美元」长约化。
- NVIDIA 网络业务单季 $14.8B、同比 +199%,验证 AI 数据中心建设正从「单纯堆 GPU」转向以 InfiniBand/Spectrum-X/NVLink 为核心的 scale-up/scale-out 网络成为 capex 增量高速增长项(SEC 8-K)。
Model
- 本 48h 窗口无通用前沿大模型首发;最新条目是 5/18 Cursor 发布的编码代理 Composer 2.5。5 月中下旬处于 4 月底密集发布(Claude Opus 4.7 / GPT-5.5 / DeepSeek V4 / Grok 4.3 / Gemini 3.1 系列)后的相对空窗,无高置信增量前沿发布;值得注意的是中西方同等基准定价差已拉大到 5-25 倍,编码/代理类模型的迭代取代了通用模型的发布节奏。
论文层(消费 paper-digest 2026-05-22,双轴:注意力/推理效率 + agentic reasoning;最强单点 KV cache 三面被攻):
- 2605.16928 Full Attention Strikes Back — 百步训练把全注意力迁移成稀疏,破解长上下文推理瓶颈(今日 HF 头部 / paper-digest #1)。
- 2605.21072 Q-ARVD — 量化自回归视频扩散模型,降低实时流式生成推理成本。
- 2605.22786 LCGuard — 守护多智能体潜空间通信,安全共享 KV 缓存。
- 2605.21850 ACC — 把智能体轨迹编译成长上下文训练数据,省去人工策展。
- 2605.20176 ClinSeekAgent — 临床推理智能体,主动检索并综合多模态证据。
- 2605.20244 Lean Refactor — 检索增强智能体,多目标可控重构 Lean 证明。
- 2605.22177 Maestro — 用强化学习编排分层模型-技能集成。
- 2605.22109 Perception or Prejudice — 评测 MLLM 能否超越对人格的第一印象偏见。
Application
- Gartner 5/20 称「企业 AI 编码代理」市场进入扩张与竞争重排新阶段——从工具试点转向规模化落地与厂商格局洗牌,呼应同窗 NVIDIA、Cursor 在编码代理上的动作。
- agentic AI 落地从「试点」转向「驻场工程」:ServiceNow×Accenture(5/6)推出 Forward Deployed Engineering 项目、Google Cloud(5/12)扩张 FDE 团队派工程师进客户现场;聚合数据显示 Q2 2026 约 31% 企业至少一个 agent 投产、约 80% 今年新发企业应用内嵌 agentic 内核。
技术信号(paper-digest 不覆盖):
- Cursor Composer 2.5(5/18,无配套论文的工具层发布)——强化 agentic coding 工具迭代节奏(whatllm.org)。
- NVlabs/GatedDeltaNet-2 官方 PyTorch 实现开源(线性注意力解耦 erase/write 双门),前作已被 Olmo Hybrid / Qwen3.5 采用(GitHub)。
层间联动影响
- chips → infra → energy:NVIDIA 数据中心 $75.2B、网络 +199% 印证 Blackwell 放量与互联升级,放大四大约 $725B capex 的算力与网络部分;算力堆叠把电力变成终极瓶颈,催生 NextEra $67B 并购 Dominion、Meta/xAI 在地燃气发电——「芯片放量→机房与网络 capex→电力供给争夺」一条传导链三层同时显形。
- chips(供给约束)→ infra(成本结构):TSMC CoWoS 良率破 98%、目标月产 13 万片,但 CoWoS/HBM 仍是节流阀,叠加内存涨价推高微软与 Meta 2026 capex 预测——封装与 HBM 的供给节奏直接决定基础设施层单位算力成本与可获得性。
- model/chips → application:通用前沿进入空窗,焦点转向编码/代理类模型(Cursor Composer 2.5)与其落地——Gartner 称企业编码 agent 进入扩张新阶段,ServiceNow/Google 以驻场工程推进 agent 投产;底层算力充裕把价值前沿从「发新模型」推向「把代理嵌进企业工作流变现」。
- chips(地缘)→ infra/model(中国分叉):NVIDIA Q2 指引零中国 DC、黄仁勋承认让位本土,BIS 放行 H200 却零发货——出口管制把全球算力切成两套体系,中国基础设施转向本土芯片,并外溢到模型层「中西方同等基准定价差拉大到 5-25 倍」。
🎙️ 播客动态
- 订阅 prefetch 在 48h 窗口仅返回 1 集且非 AI 主题:硅谷101 — E237|央视和FIFA谈判纷争背后,体育赛事转播权的博弈与生意(2026-05-21)——围绕央视与 FIFA 世界杯转播权谈判的定价逻辑与体育赛事版权生意变化,与 AI 议题无关,仅据 shownotes 如实记录,不展开。今日订阅 AI 播客无 AI 主题更新。
候选池变化与后续关注
本日发现扫描在论文/效率层捞到 2 名达标新候选并入队:
- Jan Kautz(NVIDIA VP, Learning & Perception Research|oss-ai-builders)— 5/22 paper-digest 收录其领衔的 NVIDIA 线性注意力新架构 Gated DeltaNet-2(解耦 erase/write 双门),配套官方实现 NVlabs/GatedDeltaNet-2 已开源;前作已被 Olmo Hybrid / Qwen3.5 采用,本轮 KV/线性注意力效率周期核心推手。cross_checked。
- Yanke Zhou(Nanjing University / Alibaba Group|oss-ai-builders)— 5/22 HF Daily 头部、paper-digest #1 论文 Full Attention Strikes Back 一作,与 KV 稀疏化主线直接相关。cross_checked。
两者均未达即时 promote 门槛(单源/单日信号),先入候选池观察。其余 OpenHuman/tinyhumansai(5/13 发布、超 48h 且集体署名)、Tobi Lütke(CEO 头条且 PR 存疑)按规则未纳入。当前候选池约 62 人 + runtime 跟踪 19 人,本日 +2。
来源与交叉验证说明
- 来源结构:primary/official 主导关键结论(NVIDIA SEC 8-K、OpenAI Codex changelog、Anthropic 官方页、Google Cloud I/O blog、TSMC 研讨会、arXiv/paper-digest 本地 JSON);company/filing(NVIDIA SEC、Accenture newsroom);media/analysis 交叉解读(Fortune、MIT Tech Review、TechNode、SCMP、MarkTechPost、Tom’s Hardware、Gartner、TechCrunch、winbuzzer);community/social(Simon Willison、X/@karpathy、GitHub NVlabs)。
- 交叉验证:NVIDIA Q1 FY27 业绩与 Q2 指引经 SEC 8-K + 多媒体一致交叉,主条 verified。
- 置信标注:Anthropic『Dreaming』细节来自媒体 + Simon Willison live blog(非官方 release note);Google Gemini 3.5/OpenAI 溯源研究锚在 5/19-5/20 I/O 窗口边缘;BIS H200 细节为媒体二级;NextEra-Dominion $67B 与企业 adoption 比例为 media/analysis 二手;Karpathy autoresearch 53% 被标 overfit/未合并;DeepSeek R2 仅留 unverified。
- 覆盖缺口:Meta/xAI/Mistral/DeepSeek 本 48h 静默;能源层无全新 SMR/PPA 单签;model 层无前沿首发;paper-digest 标 S2 metadata 稀疏(140 篇仅 6 篇有 tldr);X 原生搜索不可用,人物声量来自 Web 索引帖与媒体二级转述。