[市场·2026-05-19] Macro News

← 返回主报告:[市场·2026-05-19] Politics

AI 日报 · 宏观五层视图(2026-05-19,UTC)

与 2026-05-13 上一期连续:本期聚焦 2026-05-19 前后约 48 小时的新增信号;上一期结论(电力硬约束、CPO/ASIC 双寡头、超大厂 capex、开源模型推理边际成本下行、智能体落地瓶颈)作为背景。

Energy(能源)

  • 绕过电网、行为表后燃气仍是最快的 AI 供电路径:CalEthos 及其子公司 TerraVolt(8-K,2026-05-11)签署天然气 firm supply 协议,55,000 MMBtu/天,支撑爱达荷东南部 AI 数据中心园区首期 200-240 MW 自建燃气电厂;5 月 8 日支付 383 万美元预留费,并承诺最高 5,600 万美元信用证。这是 48h 窗口内对"behind-the-meter、绕过 4-7 年并网排队"成为新增产能主流采购模式的增量确认(Yahoo/GlobeNewswireManila Times 全文StockTitan 8-K)。
  • 约束已从硅转向电力:本周汇集的分析估计 2026 年约 11 GW 数据中心产能停留在"已宣布未开工",约 50% 全球项目因电力/电网设备短缺延期,高压变压器交期拉长至约 5 年;超大厂以迁址富电地区(微软 UAE 152 亿美元、Meta 路易斯安那 100 亿美元)+ 直接购电应对(MacroMicroEnkiAIManufacturing Dive/Omdia)。

Chips(芯片)

  • HBM 供给进一步收紧、且已被锁定:SK 海力士已将 DRAM/NAND/HBM 实质性售罄至 NVIDIA 2026 全年(HBM bit 份额约 50%,由 59% 回落,三星升至约 28%);NVIDIA 已要求 SK 海力士/三星/美光在 2026 Q4 交付更密的 16-Hi HBM4 供 Rubin,三星+SK 海力士被点名为 Rubin HBM4 供应商、约 3 月起出货。HBM 仍是加速器产出的瓶颈件(NotebookcheckTweakTownTrendForce)。
  • 定制 ASIC 对 NVIDIA 份额的侵蚀延续:Meta MTIA 400 完成测试并进入数据中心生产部署(下一代 MTIA 配更多 HBM 服务生成式推理),Google 刻意用 MediaTek 成本定位压 Broadcom 溢价;分析框架称 NVIDIA 加速器份额向 55-60% 漂移,Broadcom/Marvell 定制硅补位——延续上一期双寡头主线,且 Meta 自研硅已量产(OplexaTech-InsiderCNBC)。

Infra(基础设施)

  • 2026 算力 capex 确认为人类首个万亿美元年:四巨头(MSFT/AMZN/GOOGL/META)约 7,250 亿美元(同比 +77%,2025 为 4,100 亿),仅 Q1 约 1,300 亿(为 2023 Q1 的 3.7 倍);加 Oracle 约 500 亿、Apple 约 130 亿、neocloud 约 600 亿、中国约 800 亿、主权约 600 亿,合计约 1.04 万亿。Anthropic-Google Cloud(5 月 5 日披露,2,000 亿美元/5 GW/5 年)锚定需求;上限较上一期 6,900-7,550 亿美元口径上移(DataCenterRichnessFuturumGoldman Sachs)。
  • capex 与可交付算力的缺口扩大:Data Center World 2026 前后分析预计 2026 计划产能的 30-50% 因电力/变压器/电网设备短缺滑至 2027-2028 年——万亿 capex 高估了近期可用算力;机柜功率已从 30-40 kW 跳至数百 kW、逼近 MW 级(DCKManufacturing Dive)。

Model(模型生态)

  • 开源推理成本战升级:2026 年 5 月初约 12 天内连发 4 款中国前沿级开源模型——GLM-5.1(Z.ai)、MiniMax M2.7、Kimi K2.6(Moonshot)、DeepSeek V4,均在智能体编码基准上具竞争力、推理价低于 Claude Opus 1/3;为上一期"30 天 5 款开源 + 推理边际成本下行"的增量升级(abhs.inllm-statswhatllm)。
  • 西方前沿定价承压:GPT-5.5($5/$30,缓存 $0.50)成复杂编码新前沿;Anthropic 此前 67% Opus 降价(Opus 4.6/4.7 $5/$25,原 $15/$75)已是其面对开源 $0.10-0.28 报价能守的地板,评论称其溢价策略"空间所剩无几"。48h 内无西方重大前沿新版本,定价压缩是模型层主导动态(Startup FortuneDevTkAI Pricing Guru)。

Application(应用层)

  • 智能体在机构级规模跨越 pilot→生产:Broadridge(PR 5 月 11 日,报道延续至 5 月 13 日)将 agentic AI 投入后台交易/账户管理/客户服务生产(trade-fails、break resolution、估值异常),宣称首日运营成本降幅最高 30%,基于 2024 年以来 40+ BPO 客户部署——上一期"pilot→生产瓶颈"在金融运营被打破的实证(Broadridge PRPR NewswireStockTitan)。
  • "部署服务层"被搭建以攻克生产缺口:ServiceNow+Accenture 推出 Forward Deployed Engineering 项目,OpenAI 联合 19 家投资/咨询/SI 设立约 40 亿美元部署公司。反向信号:WRITER 称 79% 组织仍面临采用挑战(同比两位数上升)、约 60% 治理缺口,仅约 23-29% 见显著 genAI/智能体 ROI——采用广度真实但 ROI 兑现仍薄(AccenturePYMNTSWRITER)。

  1. Energy → Infra → Chips:电力瓶颈(变压器 5 年交期、约 50% 项目延期、约 11 GW 已宣布未开工)使 ~1.04 万亿美元 2026 算力 capex 只能部分变现,30-50% 计划产能滑至 2027-2028。这意味着加速器/HBM 需求(NVIDIA Rubin、SK 海力士 2026 全年售罄)由"表后可用兆瓦"而非晶圆/HBM 产出单独定速,从而催生 CalEthos/TerraVolt 200-240 MW 自建燃气电厂这类交易(Manufacturing DiveDataCenterRichnessYahoo)。
  2. Chips → Model → Application:定制 ASIC 成熟(Meta MTIA 400 量产、Broadcom/Marvell 双寡头、Google 以 MediaTek 压 Broadcom)叠加开源洪流(12 天 4 款中国前沿模型、价 < Opus 1/3)压垮推理边际成本;该成本崩塌正是应用层把智能体经济化推入生产的前提——Broadridge 首日降本 30% 的智能体部署、以及 ServiceNow/Accenture 与 OpenAI 部署公司,只有在 token 成本下行后才算得过账(Oplexaabhs.inBroadridge)。