AI 日报｜2026-05-25

一句话结论：5/25 周一无新旗舰，主线是 Anthropic 约 $30B / 超 $900B 估值轮（最快 5/26 当周关闭、反超 OpenAI）的资本侧定价权易主临门一脚（媒体口径、无官方确认，记 unverified），叠加 Karpathy 入职后 Anthropic 的人才+资本双磁极叙事；能力侧、宏观五层与应用层均为本周存量传导的延续。

摘要

前沿：无同日新旗舰，Gemini 3.5 Flash + Omni + Spark（I/O 5/19）、Claude Mythos、Qwen3.7-Max、DeepSeek V4 均处扩散期；高管普遍称前沿能力『势均力敌』。OpenAI 以 DeployCo（>$40 亿咨询子公司）转企业服务、据报最快 5/22 保密递交 IPO。
人物：Anthropic 持续作为顶级人才磁极（Karpathy 5/19 入职 pre-training 余波）；当日个人增量信号偏薄。
论文：双热点为多模态推理 + agent skill 自演化（SkillOpt 147 赞当日最高，与同源系统研究构成同日辩题）；paper-digest 为单源降级期（HF Daily only）。
宏观五层：延续『有钱、有电、缺封装与内存』算力兑现约束链；应用层进入试点→生产拐点但 ROI 分化。
候选池：发现扫描新增 2 名候选（Peter Pang / Shuofei Qiao），来自播客嘉宾与论文第一作者两条渠道。

Frontier Labs / Frontier Model Radar

5/25 周一前沿层无新旗舰模型发布，符合周末延续的静默常态。当日主线是『资本侧定价权易主』临门一脚与 Google『快而便宜』路线的持续扩散：Anthropic 约 $30B / 超 $900B 估值轮据多家媒体最快 5/26 当周关闭、将首次反超 OpenAI（约 $850B），叠加 Karpathy 5/19 入职 pre-training 团队，Anthropic 持续兼作人才与资本双磁极。

OpenAI — 推出 DeployCo（多数股权咨询子公司，>$40 亿）转向企业落地；据报最快 5/22 保密递交 IPO、目标 9 月。
Anthropic — Claude Mythos Preview 据报通过英国 AISI『The Last Ones』32 步靶场 10 次中 3 次、专家级任务 73% 成功率；Karpathy 5/19 入职持续发酵。
Google DeepMind — I/O 2026（5/19） Gemini 3.5 Flash + Omni world model + Spark agent，Ultra $250→$200、新增 $100 Developer 档；收编 20+ Contextual AI 研究员（$80-90M）。
Meta — 前沿模型无增量：Behemoth 截至 5/16 未发布；重心在能源侧（6GW 核电 PPA，见 Energy）。
xAI — 无新旗舰；Grok 3 开源权重仍未发布；5/22 为 Grok 新增 Vercel/Canva/Gamma/S&P 连接器。
Mistral — Devstral Small 24B（agentic 编码，HumanEval 90.1%）扩散期。
Qwen — Qwen3.7-Max（1M 上下文、闭源 preview，云栖 5/20）扩散期。
DeepSeek — V4 Preview（4/24）扩散；5/22 V4-Pro 75% 折扣转永久（$0.435/$0.87 每百万 token）。

⚠️ 未验证前沿信号：① Anthropic 约 $30B / 超 $900B 轮最快 5/26 当周关闭、反超 OpenAI，无官方确认；② OpenAI/Anthropic IPO 文件均媒体口径、无官方确认。

关键人物与社区信号

5/25 周一无重大同日产品事件，单个 tracked 人物增量信号偏薄；主线仍是 Anthropic 顶级人才磁极 叙事与资本侧反超传闻相互强化。高管普遍把前沿能力描述为『势均力敌』。

Andrej Karpathy — 5/19 加入 Anthropic pre-training 团队，本周持续作为人才磁极叙事核心；当日属余波。
Sam Altman — OpenAI 以 DeployCo（>$40 亿）转企业落地、据报最快 5/22 保密递交 IPO。
Nathan Lambert — 『开源稳定滞后闭源约一档』框架在中国开源四连发 + DeepSeek 永久降价语境下继续被引用。

Energy

电力仍是头号约束：电网接入队列成多年等待列表；Meta 签 6GW 核电 PPA（约供 500 万户）。
核电复兴：Constellation 计划 2027 重启 TMI Unit 1（835MW，售微软）；美国公用事业规划 2026 投 ~$1.4T（+27%）。

Chips

Rubin 受 HBM4 拖累：HBM4 良率低于成熟 HBM3e，Google TPU 抢 TSMC 产能。
CoWoS：TSMC $56B capex 推月产能至 13-15 万片，2026 已售罄（约 80-85 万片预留 NVIDIA）。

Infra

2026 五大超大厂 capex 共识 $660-690B](https://futurumgroup.com/insights/ai-capex-2026-the-690b-infrastructure-sprint/)（近翻倍），Big-5 AI 基础设施口径约 [$ （近翻倍），Big-5 AI 基础设施口径约 $725B。
Anthropic 对 Google Cloud 承诺 5 年 $200B / 5GW（The Information 5/5）+ Blackstone-Google $5B TPU 合资——算力资金高度集中。

Model

前沿能力被高管普遍描述为『势均力敌』：Google 以 Gemini 3.5 Flash（快而便宜）切入而非对标 Mythos 巨型版。无同日新旗舰。
中国开源定价权下压：DeepSeek V4-Pro 永久降价推理价压至闭源约 1/3，Anthropic 溢价空间承压。

📄 论文层（消费自 paper-digest 2026-05-25，单源降级期）

2605.22878 SciAtlas: A Large-Scale Knowledge Graph for Automated Scientific Research — 大规模科研知识图谱，助 agent 跨学科自动检索（当日 ranking 居首）
2605.23904 SkillOpt: Executive Strategy for Self-Evolving Agent Skills — 把 agent 技能当优化器训练实现自演化（HF 最高 147 赞）
2605.23899 From Raw Experience to Skill Consumption: A Systematic Study of Model-Generated Agent Skills — 系统研究模型生成的 agent 技能复用（与 SkillOpt 同源、同日辩题）
2605.23463 StepAudio 2.5 Technical Report — StepFun 统一音频-语言大模型（101 作者）
2605.23901 LLMs as Noisy Channels: A Shannon Perspective on Model Capacity and Scaling Laws — 用香农信道视角挑战单调幂律 scaling law
2605.20177 From Seeing to Thinking — 解耦感知与推理，改进 VLM 后训练

Application

企业 agent 进入试点→生产拐点但 ROI 分化：约 31% 已有 agent 进生产（银行/保险 47%），仅 29% 见显著 ROI、22% 12 个月后负 ROI、治理缺口约 60%、88% pilot 无法转生产。
OpenAI DeployCo + Anthropic 服务推送：竞争从模型能力转向『帮客户把 agent 跑进生产』的交付层。

🛠 技术信号（非论文，paper-digest 不覆盖）

DeepSeek 5/22 V4-Pro 75% 折扣转永久定价（$0.435/$0.87 每百万 token），开源推理价压至闭源约 1/3。
Mistral Devstral Small 24B agentic 编码专用开源权重（HumanEval 90.1%）——工具/权重发布而非论文。

层间联动影响

energy → infra → chips：核电 PPA 决定能否上电，capex $660-690B 的兑现被 HBM4 良率 + CoWoS 售罄卡住——『有钱、有电、缺封装与内存』成 2026 算力兑现三段式约束链。
infra → model → application：Anthropic 5 年 $200B/5GW 算力底座支撑反超与 Mythos，但开源永久降价迫使应用层重做单位经济学。
paper → application：SkillOpt agent 技能自演化与 SciAtlas 知识底座，正对应应用层 88% pilot 无法转生产的技能复用 + 知识缺口。

🎙️ 播客动态

硅谷101 — E238｜聊聊 Harness 时代 AI-First 的组织架构：从信任人到信任 AI — 主播泓君对话 CreaoAI 三位创始人，拆解『Harness Engineering（挽具工程）』实践：Peter Pang 一线称 99% 代码由 AI 完成、每天 3-8 次生产部署、过去六周产品流程现一天跑完；核心论点是 AI-First 不等于『使用 AI』，组织转型最难一步是让全员『信任 AI』。

候选池变化与后续关注

本日发现扫描新增 2 名达标候选，来自『播客嘉宾』与『论文第一作者』两条可靠产出渠道（X/Twitter 原生实时搜索不可用，仅 web-indexed 帖子可见，故未从 X 直接产出候选）：

Peter Pang（peter-pang，oss-ai-builders，@intuitiveml）— CreaoAI 联合创始人；硅谷101 E238 当日播客嘉宾 + 百万级阅读 Harness 长文，把 harness engineering 推向可量化的组织级实践。
Shuofei Qiao（shuofei-qiao，oss-ai-builders）— 浙江大学 ZJUNLP 博士生（Ningyu Zhang/Huajun Chen 组）；当日 paper-digest 头号论文 SciAtlas 第一作者，KnowAgent 等 knowledge-augmented agent 工作延续。

第三热点 SkillOpt 第一作者『Yifan Yang』因重名严重、无法清晰消歧而未提名（同源 companion 论文第一作者 Zisu Huang 已在候选池）。无达立即 promote 门槛者。

来源与交叉验证说明

来源分布：primary/official（arXiv 预印本原文）；media/analysis（Bloomberg/CNBC/TechTimes/Axios/CIO/TechCrunch/Tom’s Hardware/Benzinga + capex/封装/采用率分析）；community/social（HuggingFace Daily trending、X web-indexed、小宇宙 shownotes）。无同日官方 filing。
交叉验证：关键资本结论（Anthropic $30B/$900B 轮、IPO 文件）全为媒体报道、无官方确认，按 unverified 处理、不作当日主线唯一依据。论文层硬证据锚 arxiv_url，HF 热度仅作信号。宏观 capex/HBM4/CoWoS/采用率为分析机构口径、跨源数字有出入（记 confidence_flag）。
覆盖缺口：无同日新旗舰；paper-digest 单源降级（HF only）；X 原生实时搜索不可用，人物发现仅靠 web-indexed + 播客 + 论文渠道交叉；周一宏观无断点，属本周传导延续。

Hanzhi's BLOG

[市场·2026-05-25] AI