AI 日报|2026-05-25
一句话结论:5/25 周一无新旗舰,主线是 Anthropic 约 $30B / 超 $900B 估值轮(最快 5/26 当周关闭、反超 OpenAI)的资本侧定价权易主临门一脚(媒体口径、无官方确认,记 unverified),叠加 Karpathy 入职后 Anthropic 的人才+资本双磁极叙事;能力侧、宏观五层与应用层均为本周存量传导的延续。
摘要
- 前沿:无同日新旗舰,Gemini 3.5 Flash + Omni + Spark(I/O 5/19)、Claude Mythos、Qwen3.7-Max、DeepSeek V4 均处扩散期;高管普遍称前沿能力『势均力敌』。OpenAI 以 DeployCo(>$40 亿咨询子公司)转企业服务、据报最快 5/22 保密递交 IPO。
- 人物:Anthropic 持续作为顶级人才磁极(Karpathy 5/19 入职 pre-training 余波);当日个人增量信号偏薄。
- 论文:双热点为多模态推理 + agent skill 自演化(SkillOpt 147 赞当日最高,与同源系统研究构成同日辩题);paper-digest 为单源降级期(HF Daily only)。
- 宏观五层:延续『有钱、有电、缺封装与内存』算力兑现约束链;应用层进入试点→生产拐点但 ROI 分化。
- 候选池:发现扫描新增 2 名候选(Peter Pang / Shuofei Qiao),来自播客嘉宾与论文第一作者两条渠道。
Frontier Labs / Frontier Model Radar
5/25 周一前沿层无新旗舰模型发布,符合周末延续的静默常态。当日主线是『资本侧定价权易主』临门一脚与 Google『快而便宜』路线的持续扩散:Anthropic 约 $30B / 超 $900B 估值轮 据多家媒体最快 5/26 当周关闭、将首次反超 OpenAI(约 $850B),叠加 Karpathy 5/19 入职 pre-training 团队,Anthropic 持续兼作人才与资本双磁极。
- OpenAI — 推出 DeployCo(多数股权咨询子公司,>$40 亿)转向企业落地;据报最快 5/22 保密递交 IPO、目标 9 月。
- Anthropic — Claude Mythos Preview 据报通过英国 AISI『The Last Ones』32 步靶场 10 次中 3 次、专家级任务 73% 成功率;Karpathy 5/19 入职 持续发酵。
- Google DeepMind — I/O 2026(5/19) Gemini 3.5 Flash + Omni world model + Spark agent,Ultra $250→$200、新增 $100 Developer 档;收编 20+ Contextual AI 研究员($80-90M)。
- Meta — 前沿模型无增量:Behemoth 截至 5/16 未发布;重心在能源侧(6GW 核电 PPA,见 Energy)。
- xAI — 无新旗舰;Grok 3 开源权重仍未发布;5/22 为 Grok 新增 Vercel/Canva/Gamma/S&P 连接器。
- Mistral — Devstral Small 24B(agentic 编码,HumanEval 90.1%)扩散期。
- Qwen — Qwen3.7-Max(1M 上下文、闭源 preview,云栖 5/20)扩散期。
- DeepSeek — V4 Preview(4/24)扩散;5/22 V4-Pro 75% 折扣转永久($0.435/$0.87 每百万 token)。
⚠️ 未验证前沿信号:① Anthropic 约 $30B / 超 $900B 轮 最快 5/26 当周关闭、反超 OpenAI,无官方确认;② OpenAI/Anthropic IPO 文件均媒体口径、无官方确认。
关键人物与社区信号
5/25 周一无重大同日产品事件,单个 tracked 人物增量信号偏薄;主线仍是 Anthropic 顶级人才磁极 叙事与资本侧反超传闻相互强化。高管普遍把前沿能力描述为『势均力敌』。
- Andrej Karpathy — 5/19 加入 Anthropic pre-training 团队,本周持续作为人才磁极叙事核心;当日属余波。
- Sam Altman — OpenAI 以 DeployCo(>$40 亿) 转企业落地、据报最快 5/22 保密递交 IPO。
- Nathan Lambert — 『开源稳定滞后闭源约一档』框架在中国开源四连发 + DeepSeek 永久降价 语境下继续被引用。
Energy
- 电力仍是头号约束:电网接入队列 成多年等待列表;Meta 签 6GW 核电 PPA(约供 500 万户)。
- 核电复兴:Constellation 计划 2027 重启 TMI Unit 1(835MW,售微软);美国公用事业规划 2026 投 ~$1.4T(+27%)。
Chips
- Rubin 受 HBM4 拖累:HBM4 良率低于成熟 HBM3e,Google TPU 抢 TSMC 产能。
- CoWoS:TSMC $56B capex 推月产能至 13-15 万片,2026 已售罄(约 80-85 万片预留 NVIDIA)。
Infra
- 2026 五大超大厂 capex 共识 (近翻倍),Big-5 AI 基础设施口径约 $725B。
- Anthropic 对 Google Cloud 承诺 5 年 $200B / 5GW(The Information 5/5)+ Blackstone-Google $5B TPU 合资——算力资金高度集中。
Model
- 前沿能力被高管普遍描述为『势均力敌』:Google 以 Gemini 3.5 Flash(快而便宜)切入而非对标 Mythos 巨型版。无同日新旗舰。
- 中国开源定价权下压:DeepSeek V4-Pro 永久降价 推理价压至闭源约 1/3,Anthropic 溢价空间承压。
📄 论文层(消费自 paper-digest 2026-05-25,单源降级期)
- 2605.22878 SciAtlas: A Large-Scale Knowledge Graph for Automated Scientific Research — 大规模科研知识图谱,助 agent 跨学科自动检索(当日 ranking 居首)
- 2605.23904 SkillOpt: Executive Strategy for Self-Evolving Agent Skills — 把 agent 技能当优化器训练实现自演化(HF 最高 147 赞)
- 2605.23899 From Raw Experience to Skill Consumption: A Systematic Study of Model-Generated Agent Skills — 系统研究模型生成的 agent 技能复用(与 SkillOpt 同源、同日辩题)
- 2605.23463 StepAudio 2.5 Technical Report — StepFun 统一音频-语言大模型(101 作者)
- 2605.23901 LLMs as Noisy Channels: A Shannon Perspective on Model Capacity and Scaling Laws — 用香农信道视角挑战单调幂律 scaling law
- 2605.20177 From Seeing to Thinking — 解耦感知与推理,改进 VLM 后训练
Application
- 企业 agent 进入试点→生产拐点但 ROI 分化:约 31% 已有 agent 进生产(银行/保险 47%),仅 29% 见显著 ROI、22% 12 个月后负 ROI、治理缺口约 60%、88% pilot 无法转生产。
- OpenAI DeployCo + Anthropic 服务推送:竞争从模型能力转向『帮客户把 agent 跑进生产』的交付层。
🛠 技术信号(非论文,paper-digest 不覆盖)
- DeepSeek 5/22 V4-Pro 75% 折扣转永久定价($0.435/$0.87 每百万 token),开源推理价压至闭源约 1/3。
- Mistral Devstral Small 24B agentic 编码专用开源权重(HumanEval 90.1%)——工具/权重发布而非论文。
层间联动影响
- energy → infra → chips:核电 PPA 决定能否上电,capex $660-690B 的兑现被 HBM4 良率 + CoWoS 售罄卡住——『有钱、有电、缺封装与内存』成 2026 算力兑现三段式约束链。
- infra → model → application:Anthropic 5 年 $200B/5GW 算力底座 支撑反超与 Mythos,但开源永久降价 迫使应用层重做单位经济学。
- paper → application:SkillOpt agent 技能自演化 与 SciAtlas 知识底座,正对应应用层 88% pilot 无法转生产 的技能复用 + 知识缺口。
🎙️ 播客动态
- 硅谷101 — E238|聊聊 Harness 时代 AI-First 的组织架构:从信任人到信任 AI — 主播泓君对话 CreaoAI 三位创始人,拆解『Harness Engineering(挽具工程)』实践:Peter Pang 一线称 99% 代码由 AI 完成、每天 3-8 次生产部署、过去六周产品流程现一天跑完;核心论点是 AI-First 不等于『使用 AI』,组织转型最难一步是让全员『信任 AI』。
候选池变化与后续关注
本日发现扫描新增 2 名达标候选,来自『播客嘉宾』与『论文第一作者』两条可靠产出渠道(X/Twitter 原生实时搜索不可用,仅 web-indexed 帖子可见,故未从 X 直接产出候选):
- Peter Pang(
peter-pang,oss-ai-builders,@intuitiveml)— CreaoAI 联合创始人;硅谷101 E238 当日播客嘉宾 + 百万级阅读 Harness 长文,把 harness engineering 推向可量化的组织级实践。 - Shuofei Qiao(
shuofei-qiao,oss-ai-builders)— 浙江大学 ZJUNLP 博士生(Ningyu Zhang/Huajun Chen 组);当日 paper-digest 头号论文 SciAtlas 第一作者,KnowAgent 等 knowledge-augmented agent 工作延续。
第三热点 SkillOpt 第一作者『Yifan Yang』因重名严重、无法清晰消歧而未提名(同源 companion 论文第一作者 Zisu Huang 已在候选池)。无达立即 promote 门槛者。
来源与交叉验证说明
- 来源分布:primary/official(arXiv 预印本原文);media/analysis(Bloomberg/CNBC/TechTimes/Axios/CIO/TechCrunch/Tom’s Hardware/Benzinga + capex/封装/采用率分析);community/social(HuggingFace Daily trending、X web-indexed、小宇宙 shownotes)。无同日官方 filing。
- 交叉验证:关键资本结论(Anthropic $30B/$900B 轮、IPO 文件)全为媒体报道、无官方确认,按 unverified 处理、不作当日主线唯一依据。论文层硬证据锚 arxiv_url,HF 热度仅作信号。宏观 capex/HBM4/CoWoS/采用率为分析机构口径、跨源数字有出入(记 confidence_flag)。
- 覆盖缺口:无同日新旗舰;paper-digest 单源降级(HF only);X 原生实时搜索不可用,人物发现仅靠 web-indexed + 播客 + 论文渠道交叉;周一宏观无断点,属本周传导延续。