[市场·2026-05-25] AI

AI 日报|2026-05-25

一句话结论:5/25 周一无新旗舰,主线是 Anthropic 约 $30B / 超 $900B 估值轮(最快 5/26 当周关闭、反超 OpenAI)的资本侧定价权易主临门一脚(媒体口径、无官方确认,记 unverified),叠加 Karpathy 入职后 Anthropic 的人才+资本双磁极叙事;能力侧、宏观五层与应用层均为本周存量传导的延续。

摘要

  • 前沿:无同日新旗舰,Gemini 3.5 Flash + Omni + Spark(I/O 5/19)、Claude Mythos、Qwen3.7-Max、DeepSeek V4 均处扩散期;高管普遍称前沿能力『势均力敌』。OpenAI 以 DeployCo(>$40 亿咨询子公司)转企业服务、据报最快 5/22 保密递交 IPO。
  • 人物:Anthropic 持续作为顶级人才磁极(Karpathy 5/19 入职 pre-training 余波);当日个人增量信号偏薄。
  • 论文:双热点为多模态推理 + agent skill 自演化(SkillOpt 147 赞当日最高,与同源系统研究构成同日辩题);paper-digest 为单源降级期(HF Daily only)。
  • 宏观五层:延续『有钱、有电、缺封装与内存』算力兑现约束链;应用层进入试点→生产拐点但 ROI 分化。
  • 候选池:发现扫描新增 2 名候选(Peter Pang / Shuofei Qiao),来自播客嘉宾与论文第一作者两条渠道。

Frontier Labs / Frontier Model Radar

5/25 周一前沿层无新旗舰模型发布,符合周末延续的静默常态。当日主线是『资本侧定价权易主』临门一脚与 Google『快而便宜』路线的持续扩散:Anthropic 约 $30B / 超 $900B 估值轮 据多家媒体最快 5/26 当周关闭、将首次反超 OpenAI(约 $850B),叠加 Karpathy 5/19 入职 pre-training 团队,Anthropic 持续兼作人才与资本双磁极。

  • OpenAI — 推出 DeployCo(多数股权咨询子公司,>$40 亿)转向企业落地;据报最快 5/22 保密递交 IPO、目标 9 月。
  • AnthropicClaude Mythos Preview 据报通过英国 AISI『The Last Ones』32 步靶场 10 次中 3 次、专家级任务 73% 成功率;Karpathy 5/19 入职 持续发酵。
  • Google DeepMindI/O 2026(5/19) Gemini 3.5 Flash + Omni world model + Spark agent,Ultra $250→$200、新增 $100 Developer 档;收编 20+ Contextual AI 研究员($80-90M)。
  • Meta — 前沿模型无增量:Behemoth 截至 5/16 未发布;重心在能源侧(6GW 核电 PPA,见 Energy)。
  • xAI — 无新旗舰;Grok 3 开源权重仍未发布;5/22 为 Grok 新增 Vercel/Canva/Gamma/S&P 连接器。
  • MistralDevstral Small 24B(agentic 编码,HumanEval 90.1%)扩散期。
  • QwenQwen3.7-Max(1M 上下文、闭源 preview,云栖 5/20)扩散期。
  • DeepSeek — V4 Preview(4/24)扩散;5/22 V4-Pro 75% 折扣转永久($0.435/$0.87 每百万 token)。

⚠️ 未验证前沿信号:① Anthropic 约 $30B / 超 $900B 轮 最快 5/26 当周关闭、反超 OpenAI,无官方确认;② OpenAI/Anthropic IPO 文件均媒体口径、无官方确认。

关键人物与社区信号

5/25 周一无重大同日产品事件,单个 tracked 人物增量信号偏薄;主线仍是 Anthropic 顶级人才磁极 叙事与资本侧反超传闻相互强化。高管普遍把前沿能力描述为『势均力敌』。

Energy

Chips

  • Rubin 受 HBM4 拖累:HBM4 良率低于成熟 HBM3e,Google TPU 抢 TSMC 产能。
  • CoWoS:TSMC $56B capex 推月产能至 13-15 万片,2026 已售罄(约 80-85 万片预留 NVIDIA)。

Infra

Model

  • 前沿能力被高管普遍描述为『势均力敌』:Google 以 Gemini 3.5 Flash(快而便宜)切入而非对标 Mythos 巨型版。无同日新旗舰。
  • 中国开源定价权下压:DeepSeek V4-Pro 永久降价 推理价压至闭源约 1/3,Anthropic 溢价空间承压。

📄 论文层(消费自 paper-digest 2026-05-25,单源降级期)

  • 2605.22878 SciAtlas: A Large-Scale Knowledge Graph for Automated Scientific Research — 大规模科研知识图谱,助 agent 跨学科自动检索(当日 ranking 居首)
  • 2605.23904 SkillOpt: Executive Strategy for Self-Evolving Agent Skills — 把 agent 技能当优化器训练实现自演化(HF 最高 147 赞)
  • 2605.23899 From Raw Experience to Skill Consumption: A Systematic Study of Model-Generated Agent Skills — 系统研究模型生成的 agent 技能复用(与 SkillOpt 同源、同日辩题)
  • 2605.23463 StepAudio 2.5 Technical Report — StepFun 统一音频-语言大模型(101 作者)
  • 2605.23901 LLMs as Noisy Channels: A Shannon Perspective on Model Capacity and Scaling Laws — 用香农信道视角挑战单调幂律 scaling law
  • 2605.20177 From Seeing to Thinking — 解耦感知与推理,改进 VLM 后训练

Application

🛠 技术信号(非论文,paper-digest 不覆盖)

  • DeepSeek 5/22 V4-Pro 75% 折扣转永久定价($0.435/$0.87 每百万 token),开源推理价压至闭源约 1/3。
  • Mistral Devstral Small 24B agentic 编码专用开源权重(HumanEval 90.1%)——工具/权重发布而非论文。

层间联动影响

🎙️ 播客动态

候选池变化与后续关注

本日发现扫描新增 2 名达标候选,来自『播客嘉宾』与『论文第一作者』两条可靠产出渠道(X/Twitter 原生实时搜索不可用,仅 web-indexed 帖子可见,故未从 X 直接产出候选):

  • Peter Pangpeter-pang,oss-ai-builders,@intuitiveml)— CreaoAI 联合创始人;硅谷101 E238 当日播客嘉宾 + 百万级阅读 Harness 长文,把 harness engineering 推向可量化的组织级实践。
  • Shuofei Qiaoshuofei-qiao,oss-ai-builders)— 浙江大学 ZJUNLP 博士生(Ningyu Zhang/Huajun Chen 组);当日 paper-digest 头号论文 SciAtlas 第一作者,KnowAgent 等 knowledge-augmented agent 工作延续。

第三热点 SkillOpt 第一作者『Yifan Yang』因重名严重、无法清晰消歧而未提名(同源 companion 论文第一作者 Zisu Huang 已在候选池)。无达立即 promote 门槛者。

来源与交叉验证说明

  • 来源分布:primary/official(arXiv 预印本原文);media/analysis(Bloomberg/CNBC/TechTimes/Axios/CIO/TechCrunch/Tom’s Hardware/Benzinga + capex/封装/采用率分析);community/social(HuggingFace Daily trending、X web-indexed、小宇宙 shownotes)。无同日官方 filing。
  • 交叉验证:关键资本结论(Anthropic $30B/$900B 轮、IPO 文件)全为媒体报道、无官方确认,按 unverified 处理、不作当日主线唯一依据。论文层硬证据锚 arxiv_url,HF 热度仅作信号。宏观 capex/HBM4/CoWoS/采用率为分析机构口径、跨源数字有出入(记 confidence_flag)。
  • 覆盖缺口:无同日新旗舰;paper-digest 单源降级(HF only);X 原生实时搜索不可用,人物发现仅靠 web-indexed + 播客 + 论文渠道交叉;周一宏观无断点,属本周传导延续。

相关细分报告