← 返回主报告：[市场·2026-05-19] Politics

AI 日报 · 宏观五层视图（2026-05-19，UTC）

与 2026-05-13 上一期连续：本期聚焦 2026-05-19 前后约 48 小时的新增信号；上一期结论（电力硬约束、CPO/ASIC 双寡头、超大厂 capex、开源模型推理边际成本下行、智能体落地瓶颈）作为背景。

绕过电网、行为表后燃气仍是最快的 AI 供电路径：CalEthos 及其子公司 TerraVolt（8-K，2026-05-11）签署天然气 firm supply 协议，55,000 MMBtu/天，支撑爱达荷东南部 AI 数据中心园区首期 200-240 MW 自建燃气电厂；5 月 8 日支付 383 万美元预留费，并承诺最高 5,600 万美元信用证。这是 48h 窗口内对"behind-the-meter、绕过 4-7 年并网排队"成为新增产能主流采购模式的增量确认（Yahoo/GlobeNewswire，Manila Times 全文，StockTitan 8-K）。
约束已从硅转向电力：本周汇集的分析估计 2026 年约 11 GW 数据中心产能停留在"已宣布未开工"，约 50% 全球项目因电力/电网设备短缺延期，高压变压器交期拉长至约 5 年；超大厂以迁址富电地区（微软 UAE 152 亿美元、Meta 路易斯安那 100 亿美元）+ 直接购电应对（MacroMicro，EnkiAI，Manufacturing Dive/Omdia）。

HBM 供给进一步收紧、且已被锁定：SK 海力士已将 DRAM/NAND/HBM 实质性售罄至 NVIDIA 2026 全年（HBM bit 份额约 50%，由 59% 回落，三星升至约 28%）；NVIDIA 已要求 SK 海力士/三星/美光在 2026 Q4 交付更密的 16-Hi HBM4 供 Rubin，三星+SK 海力士被点名为 Rubin HBM4 供应商、约 3 月起出货。HBM 仍是加速器产出的瓶颈件（Notebookcheck，TweakTown，TrendForce）。
定制 ASIC 对 NVIDIA 份额的侵蚀延续：Meta MTIA 400 完成测试并进入数据中心生产部署（下一代 MTIA 配更多 HBM 服务生成式推理），Google 刻意用 MediaTek 成本定位压 Broadcom 溢价；分析框架称 NVIDIA 加速器份额向 55-60% 漂移，Broadcom/Marvell 定制硅补位——延续上一期双寡头主线，且 Meta 自研硅已量产（Oplexa，Tech-Insider，CNBC）。

2026 算力 capex 确认为人类首个万亿美元年：四巨头（MSFT/AMZN/GOOGL/META）约 7,250 亿美元（同比 +77%，2025 为 4,100 亿），仅 Q1 约 1,300 亿（为 2023 Q1 的 3.7 倍）；加 Oracle 约 500 亿、Apple 约 130 亿、neocloud 约 600 亿、中国约 800 亿、主权约 600 亿，合计约 1.04 万亿。Anthropic-Google Cloud（5 月 5 日披露，2,000 亿美元/5 GW/5 年）锚定需求；上限较上一期 6,900-7,550 亿美元口径上移（DataCenterRichness，Futurum，Goldman Sachs）。
capex 与可交付算力的缺口扩大：Data Center World 2026 前后分析预计 2026 计划产能的 30-50% 因电力/变压器/电网设备短缺滑至 2027-2028 年——万亿 capex 高估了近期可用算力；机柜功率已从 30-40 kW 跳至数百 kW、逼近 MW 级（DCK，Manufacturing Dive）。

开源推理成本战升级：2026 年 5 月初约 12 天内连发 4 款中国前沿级开源模型——GLM-5.1（Z.ai）、MiniMax M2.7、Kimi K2.6（Moonshot）、DeepSeek V4，均在智能体编码基准上具竞争力、推理价低于 Claude Opus 1/3；为上一期"30 天 5 款开源 + 推理边际成本下行"的增量升级（abhs.in，llm-stats，whatllm）。
西方前沿定价承压：GPT-5.5（$5/$30，缓存 $0.50）成复杂编码新前沿；Anthropic 此前 67% Opus 降价（Opus 4.6/4.7 $5/$25，原 $15/$75）已是其面对开源 $0.10-0.28 报价能守的地板，评论称其溢价策略"空间所剩无几"。48h 内无西方重大前沿新版本，定价压缩是模型层主导动态（Startup Fortune，DevTk，AI Pricing Guru）。

智能体在机构级规模跨越 pilot→生产：Broadridge（PR 5 月 11 日，报道延续至 5 月 13 日）将 agentic AI 投入后台交易/账户管理/客户服务生产（trade-fails、break resolution、估值异常），宣称首日运营成本降幅最高 30%，基于 2024 年以来 40+ BPO 客户部署——上一期"pilot→生产瓶颈"在金融运营被打破的实证（Broadridge PR，PR Newswire，StockTitan）。
"部署服务层"被搭建以攻克生产缺口：ServiceNow+Accenture 推出 Forward Deployed Engineering 项目，OpenAI 联合 19 家投资/咨询/SI 设立约 40 亿美元部署公司。反向信号：WRITER 称 79% 组织仍面临采用挑战（同比两位数上升）、约 60% 治理缺口，仅约 23-29% 见显著 genAI/智能体 ROI——采用广度真实但 ROI 兑现仍薄（Accenture，PYMNTS，WRITER）。

Energy → Infra → Chips：电力瓶颈（变压器 5 年交期、约 50% 项目延期、约 11 GW 已宣布未开工）使 ~1.04 万亿美元 2026 算力 capex 只能部分变现，30-50% 计划产能滑至 2027-2028。这意味着加速器/HBM 需求（NVIDIA Rubin、SK 海力士 2026 全年售罄）由"表后可用兆瓦"而非晶圆/HBM 产出单独定速，从而催生 CalEthos/TerraVolt 200-240 MW 自建燃气电厂这类交易（Manufacturing Dive，DataCenterRichness，Yahoo）。
Chips → Model → Application：定制 ASIC 成熟（Meta MTIA 400 量产、Broadcom/Marvell 双寡头、Google 以 MediaTek 压 Broadcom）叠加开源洪流（12 天 4 款中国前沿模型、价 < Opus 1/3）压垮推理边际成本；该成本崩塌正是应用层把智能体经济化推入生产的前提——Broadridge 首日降本 30% 的智能体部署、以及 ServiceNow/Accenture 与 OpenAI 部署公司，只有在 token 成本下行后才算得过账（Oplexa，abhs.in，Broadridge）。

Hanzhi's BLOG