[市场·2026-05-11] AI

AI 日报|2026-05-11|OpenAI EU Cyber Action Plan + DeployCo × Anthropic Mythos 监管二分 × DeepMind AI co-mathematician

一句话结论:5/11 主线由 OpenAI 在欧盟 / 企业部署双线全力推进Anthropic Mythos 仍受 Project Glasswing 限定 的对照撑住——OpenAI 同日落下 EU Cyber Action Plan(GPT-5.5 + GPT-5.5-Cyber 接入欧洲 trusted-access)+ DeployCo(OpenAI Deployment Company,$4B 初始 / ~$10B 整体,TPG/Advent/Bain/Brookfield 联席 + 收购 Tomoro 含 150 人交付队伍),与此同时 Google DeepMind 公布 AI co-mathematician(Gemini 3.1 Pro 多代理工作台,FrontierMath Tier 4 48%,攻破 1965 年 Kourovka 21.10)把 frontier-LLM 推到 AI for Science 真实开放问题侧。

摘要

5/11 AI 日报四条主线:

  1. OpenAI 双线落地 — 同日推出 EU Cyber Action Plan(GPT-5.5 + GPT-5.5-Cyber 接入欧洲企业 / 政府 / 欧盟机构 trusted-access 框架)+ DeployCo(OpenAI Deployment Company,初始 $4B、整体 ~$10B,约 150 人交付队伍,同日收购 Tomoro 含 Mattel / Red Bull / Tesco / Virgin Atlantic 客户底,BBVA 首批企业客户)。
  2. Anthropic Mythos × EU 监管对峙 — Anthropic 仍以 Project Glasswing 把 Claude Mythos 限定在约 40 家美方司法管辖伙伴;欧盟与 Anthropic 已开过 4-5 次会议但仍未给出预览路径,与 OpenAI EU 通路形成监管 / 供给二分。
  3. DeepMind AI co-mathematician 发布 — Gemini 3.1 Pro 层级多代理工作台(项目协调员 → 文献 / 库 / 反例 workstream → 搜索 + 编码 + Deep Think 子代理),FrontierMath Tier 4 48%(vs Pro 19% / Deep Think 70%),辅助牛津 Marc Lackenby 攻破 Kourovka Notebook 21.10。
  4. paper-digest 47 候选三源齐备 — Agent × Multimodal Search × Inference 加速三路撑起:DTap 红队平台(Percy Liang 署名)+ LLMs-Improving-LLMs(agentic TTS)+ HyperEyes / InterLV-Search 多模态代理搜索基准双信号 + SpecBlock +8-13% over EAGLE-3 + ReasonMaxxer RL-free 反命题。

Frontier Labs / Frontier Model Radar

5/11 主线由 EU × frontier-AI 监管谈判带动:OpenAI 公布 EU Cyber Action Plan,把 GPT-5.5 + GPT-5.5-Cyber 接入欧洲企业 / 政府 / EU AI Office 的 trusted-access 通道,与 Anthropic 仍以 Project Glasswing 把 Claude Mythos 卡在欧盟外形成强对比。Google DeepMind 同日发表 AI co-mathematician 把 frontier-LLM 的 AI for Science 应用拉到 60 年 Kourovka 21.10 真解开盘。Meta Avocado 旗舰仍在 5 月窗口内打补丁,xAI / Mistral / DeepSeek / Qwen 5/11 当日无独立旗舰公告。

  • OpenAI · GPT-5.5 + GPT-5.5-Cyber EU 通路 — 5/11 EU Cyber Action Plan:把 GPT-5.5 与 GPT-5.5-Cyber 接入欧洲企业、政府、欧盟机构(含 EU AI Office)trusted-access 框架(身份验证 + 账户级控制 + 用途审批 + 监控分层)。GPT-5.5-Cyber 限定预览面向已审核红队 / 渗透 / 验证场景放开更宽容的安全任务行为。(OpenAI, CNBC)
  • OpenAI · DeployCo 正式启动 — OpenAI 控股、TPG 领投、Advent × Bain × Brookfield 联席 founding partner、BBVA 首批企业;初始 $4B+、整体 ~$10B、约 150 人交付团队,同日收购咨询 / 工程公司 Tomoro 完成人员补强。(OpenAI, Axios, BBVA)
  • Anthropic · Mythos 欧盟门户仍未打开 — 5/11 报道:Anthropic 仍以 Project Glasswing 把 Claude Mythos Preview 限定在约 40 家美方司法管辖伙伴(Amazon / Apple / Google / Microsoft / Nvidia / JPMorgan 等);EU 已开过 4-5 次会议但仍未给出预览路径。(CNBC, TheNextWeb)
  • Google DeepMind · AI co-mathematician — 5/11 公布基于 Gemini 3.1 Pro 的层级多代理研究工作台;FrontierMath Tier 4 上 48 题答对 23 题(48% vs Gemini 3.1 Pro baseline 19% / Deep Think 70%),并辅助牛津 Marc Lackenby 攻下 1965 年起记录的 Kourovka Notebook 21.10 号开放群论问题。(The Rundown AI, OfficeChai, arXiv 2605.06651)
  • Meta · Avocado 5 月窗口 — 旗舰仍处于 3 月被推迟到 5 月的窗口内:内部测试推理 / 编码 / 写作落后 Google / OpenAI / Anthropic,定位 Gemini 2.5–3.0 之间;5/11 无独立 GA 公告。(TheNextWeb, MLQ)
  • xAI / Mistral / Qwen / DeepSeek 5/11 无独立公告 — Grok Connectors + Imagine Quality Mode、Mistral Medium 3.5(4/29 GA)、Qwen 3.6 系列、DeepSeek V4 Pro/Flash promo 至 5/31 仍是当前公开旗舰。(Releasebot xAI, RevolutionInAI, Codersera)

未确认信号(watchlist):

  • DeployCo 估值锚 $14B(Axios 标题)vs ~$10B 全资本化(Bloomberg / OpenAI 官方)口径未对齐。(Axios, Bloomberg)
  • Meta ‘临时授权 Gemini 给 Meta 产品过渡’ 仍是 PYMNTS / Fortune Tech / TechBuzz 转引,Meta 官方未表态。(PYMNTS, Fortune)

关键人物与社区信号

5/11 关键人物侧主线被 Google DeepMind AI co-mathematician 发布和 OpenAI EU Cyber Action Plan + DeployCo 同日落地撑住。

  • Pushmeet Kohli — 5/11 X 长帖宣布 GoogleDeepMind AI co-mathematician 发布;候选池 tracked_runtime 已有定位 AI for Science 主线话事人。
  • Sam Altman — 5/11 OpenAI DeployCo + EU Cyber Action Plan 双线公告;Musk v. Altman 周二 持续高曝光。
  • Simon Willison4/30 GPT-5.5-Cyber 评测 + 5/6 Code w/ Claude SF 长记 + ‘agent 命名收敛’;5/11 EU Cyber Action Plan 把这条评测链推入主流监管延伸阅读。
  • Cat Wu — 5/6 Code w/ Claude SF 主线 PM 演讲(Claude Code 三层 surface + Routines + 子代理)+ Lenny’s Newsletter 长访谈 5/11 仍在 dev 社区扩散。
  • Ami Vora — 5/6 Code w/ Claude SF 主旨开场信号(Anthropic 整租 SpaceX Colossus 1 / API volume 17x 同比)5/11 仍作为 Anthropic-EU Mythos 谈判算力 × 用量背景被引用。
  • Andrej KarpathySequoia Ascent fireside ‘从 vibe coding 到 agentic engineering’ 5/11 持续被引用;与 DeployCo × 企业 AI 部署主线形成宏观应用层叙事配合。
  • Amanda Askell / Boris Cherny — Anthropic 模型行为 + Claude Code 工程主线仍在 EU Mythos 谈判 / Anthropic 80x 增长报道(Fortune)背景内继续延伸。

Energy

  • 数据中心电力瓶颈进一步硬化 — 约 11 GW 的 2026 计划数据中心容量仍停留在公告阶段未动工,全球 50% 项目因电网瓶颈延期;PJM Interconnection 自评 2027 缺口 6 GW;2023→2028 需求由 176 TWh 升至 325-580 TWh。Cleanview 2 月:30% 新增数据中心走 on-site 自发电(Oracle Project Jupiter 已切换到 100% Bloom 燃料电池微网),预测可升至 50%。(Common Dreams, Belfer Center, EnkiAI, Data Center Frontier)
  • SMR × AI 数据中心 5/6 双 MOU 在 5/11 当周延续 — Terrestrial Energy × Riot Platforms(核电大规模数据中心合作)+ NANO Nuclear × Supermicro(先进 microreactor 与 AI 服务器集成 MOU);NRC 预计 2026 年签发首两张商业 SMR 建设许可,AWS $20B 投资宾州(含 Talen 现有核电站内新建 SMR 路径)继续推进。(Riot Platforms, NANO Nuclear, iRecruit)

Chips

  • 三家继续分化 — NVIDIA Blackwell + Vera Rubin 2026-2027 计划销售约 $1T;Broadcom 继续靠定制 ASIC(XPU)与超大客户绑定,Q1 FY26 XPU 同比 +106%;AMD ‘Helios’ rack-scale(72 颗 MI450 Series GPU)定档 Q3 2026 部署。NVIDIA GTC(3 月)已确认 CPU 路线图(Vera)成为 AI 芯片下一阶段叙事核心。(Parameter, TipRanks, CNBC GTC)

Infra

  • Q1 2026 hyperscaler 增速继续分化 — Google Cloud +63% YoY 到 $20B、AWS +28%、Azure +40%;Amazon/Alphabet/Microsoft/Meta 四家 2026 capex 合计 $650-700B(约为 2025 双倍)。‘Magnificent Capex’ 当周报道(5/8)继续放大 AI infra 资本开支 × 财务回报的市场关注度,5/11 OpenAI DeployCo 把 $4B 初始 / $10B 整体级 enterprise 部署资本压进同一条赛道。(MindStudio, Tom Tunguz, Futurum, Ferguson Wellman)
  • Google / Microsoft 控制面叙事继续硬化 — Google 重新设计基础设施支撑 ‘persistent always-on agents’(与训练 next model 是根本不同工作负载);Microsoft 5 月发布 Intelligent Purview 服务把 DLP 实时延伸到 AI prompt / response 层,明确把 enterprise agent 治理控制面做成 P&L 中心。(Google Cloud Blog, SiliconANGLE, Windows News)

Model

  • GPT-5.5 / GPT-5.5-Cyber × EU Cyber Action Plan vs Anthropic Mythos / Project Glasswing 二分 — 5/11 OpenAI 把 GPT-5.5 + GPT-5.5-Cyber 接入欧洲企业 / 政府 / 欧盟机构 trusted-access 框架,与 Anthropic 仍以 Project Glasswing 限定在美方司法管辖伙伴形成 EU 监管 / 美方供给二分;OpenAI DeployCo 同日落地把 $4B+ 部署资本压进 enterprise frontier 模型推广侧。(OpenAI, OpenAI DeployCo, CNBC)
  • Gemini 3.1 Pro × AI co-mathematician — Google DeepMind 5/11 公布多代理工作台,把 Gemini 3.1 Pro 推到 AI for Science 真实开放问题侧第一手公开案例(FrontierMath Tier 4 48% vs Gemini 3.1 Pro baseline 19% / Deep Think 70%)。(The Rundown AI, OfficeChai, arXiv 2605.06651)

paper-digest 5/11 直接消费(Top picks,model 层折叠):

  • 2605.04808 DecodingTrust-Agent Platform (DTap) — DTap 红队平台覆盖 14 领域 50+ 环境压测 AI 代理。
  • 2605.08083 LLMs Improving LLMs: Agentic Discovery for Test-Time Scaling — 代理自动发现 TTS 策略,胜过人工启发式调度。
  • 2605.06716 From Storage to Experience: LLM Agent Memory — Storage→Reflection→Experience 三阶段框架。
  • 2605.06241 ReasonMaxxer (RL-free reasoning) — 熵门控对比损失替代 RL,单卡分钟级训练。
  • 2605.07243 SpecBlock — 块迭代推测解码比 EAGLE-3 提速 8-13%(推理加速主线唯一硬 benchmark)。

Application

  • OpenAI DeployCo 正式启动 — 5/11 OpenAI 控股,约 150 人交付队伍(同日收购 Tomoro,含 Mattel / Red Bull / Tesco / Virgin Atlantic 客户底)、TPG/Advent/Bain/Brookfield 联席、BBVA 首批企业客户;目标是把 frontier 模型推到大型企业内部 ‘AI 部署工程师 + 客户团队’ 现场工作模式。(OpenAI, OfficeChai, Axios)
  • Healthcare × Finance enterprise AI 从 pilot 走到 production — 63% 医疗组织已用 AI、50%+ 报告 ≥2x ROI、平均 14 个月回本 $3.20/dollar;75% 美国医疗系统已用或将用 AI 平台,50% 已用 ≥3 应用。PwC × Anthropic 在 5 月扩张 Enterprise AI Plugins(首先 AI Native Finance + Healthcare & Life Sciences)。(Fierce Healthcare, PwC × Anthropic)

paper-digest 5/11 application 层 technical signals:

  • 2512.18181 MACE-Dance — 级联 MoE 合成音乐驱动舞蹈视频(本周 MoE 主线首条具象化应用,HF rank 12 / 80 upvotes)。
  • 2605.07177 HyperEyes — 把效率写进 RL 目标,多模态搜索改并行原子动作 + IMEB 基准 300 实例。
  • 2605.07510 InterLV-Search — 首个交错多模态代理搜索基准。

层间联动影响

  • Energy × Infra × Application — 数据中心电力瓶颈 + on-site 自发电从 0% 升至 30% 趋势抬高 hyperscaler capex 单位发电成本,把 enterprise AI 部署侧(OpenAI DeployCo + PwC × Anthropic)推向 ‘推理 ROI 必须可量化’ 纪律;SpecBlock 类推理加速 +8-13% 直接转换为电费 / GPU-hour ROI 弹药。(Common Dreams, Futurum, OpenAI DeployCo, arXiv 2605.07243)
  • Model × Application × 监管 — OpenAI 把 GPT-5.5-Cyber 推进 EU trusted-access 与 Anthropic Mythos 仍由 Project Glasswing 限定在美方司法管辖伙伴的对照,把 frontier-cyber-AI 准入直接变成 EU 监管 / 美方供给二分;同时给企业 AI 部署侧(DeployCo / PwC × Anthropic)的合规 / 数据 residency 模板提供新坐标。(CNBC, OpenAI, TheNextWeb)
  • Chips × Model × Application — NVIDIA Vera Rubin 2026-2027 ~$1T × Broadcom XPU 定制 ASIC × AMD Helios MI450 三家分化 vs 5/11 DeepMind AI co-mathematician(Gemini 3.1 Pro 多代理)+ ReasonMaxxer ‘RL-free’ 反命题:如果推理 / 数学真能靠多代理 + RL-free + 推测解码硬抽到 +48% FrontierMath / +8-13% speedup,则下一代 chips 的 capex 投入产出比将被产品 / 应用层倒逼重定价。(TipRanks, The Rundown AI, arXiv 2605.06241)

🎙️ 播客动态

候选池变化与后续关注

5/11 发现扫描产出 3 位新候选

  • Mario Zechner(@badlogic,oss-ai-builders)— pi-mono / OpenClaw 引擎作者;pi-mono(44K+ stars、MIT、TypeScript monorepo:pi-ai / pi-agent-core / pi-coding-agent / pi-tui)继续作为 OpenClaw(250K+ stars)的底层 agent 引擎扩散;‘pi 不加 MCP / built-in todos / plan mode / background bash’ 的 minimalist 设计哲学(Implicator, Pocoo)是 OSS coding-agent harness 主线最纯粹的 4-tool 极简范式作者;推荐尽快入 tracked_runtime。
  • Daniel Zheng(ai-generalists)— AI Co-Mathematician 论文 一作;与 Pushmeet Kohli / Alex Davies / Lars Buesing 等 18 人合著,把 Gemini 3.1 Pro 多代理工作台公开化,FrontierMath Tier 4 48% + Kourovka 21.10 真解;推荐尽快入 tracked_runtime。
  • Marc Lackenby(ai-generalists)— 牛津拓扑学家,用 Google DeepMind AI co-mathematician 攻下 Kourovka Notebook 21.10;‘初稿被审稿子代理标出逻辑缺口 → 人类研究者抓住底层策略 → 子代理重构完整证明’ 的人机协同链路是后续 AI for Science case-study 模板;建议入 candidate_queue。

后续关注:

  • DeployCo $14B vs $10B 估值锚口径对齐
  • Meta Avocado 5 月 GA 窗口内具体节奏
  • Anthropic Mythos 是否走欧盟单独 sandbox 时间表
  • xAI / Mistral / Qwen / DeepSeek 5 月后续旗舰节奏(5/11 全部 stale-day)

来源与交叉验证说明

来源混合:primary / official(OpenAI news、DeepMind Blog、Anthropic news、Google Cloud Blog、xAI Docs、arXiv、NRC、PJM、Belfer Center);company / filing(NANO Nuclear、Riot Platforms、BBVA、HuggingFace Daily);media / analysis(CNBC、Bloomberg、Axios、Fortune、MIT Tech Review、TechCrunch、TheNextWeb、Common Dreams、Reuters、Banking Exchange、Officechai、Implicator、TipRanks、Futurum、Tomasz Tunguz、Releasebot、Codersera、RevolutionInAI、Fierce Healthcare、PYMNTS、PwC press);community / social(Simon Willison blog/substack、Karpathy bearblog、Lenny’s Newsletter、Pushmeet Kohli X、Mario Zechner blog/Pocoo、Abit.ee、TheRundown.ai、36Kr EU)。

交叉验证:OpenAI EU Cyber Action Plan 由 OpenAI 官方 + CNBC + EdTech Innovation Hub 三源;DeployCo 由 OpenAI 官方 PR + Axios + Bloomberg + Officechai + BBVA 多源;Anthropic Mythos EU holdout 由 CNBC + TheNextWeb + Banking Exchange 三源;DeepMind AI co-mathematician 由 The Rundown AI + OfficeChai + Abit.ee + Pushmeet Kohli X 多源 + 配套 arXiv 论文;paper-digest 5/11 47 候选三源齐备。

覆盖缺口:DeployCo 估值锚 $14B vs ~$10B 口径未对齐;Meta Avocado 5 月 GA 节奏未公开;EU Cyber Action Plan 已审核客户列表 / 单笔上限 / 期限未公开;Mythos 欧盟单独 sandbox 时间表未给;xAI / Mistral / Qwen / DeepSeek 5/11 当日 stale-day;paper-digest 自评 S2 相似论文链路全候选未返回;AI co-mathematician arXiv id 尚未进入 paper-digest top_picks(HF Daily cross-list 节奏滞后);候选池 3 位新人物的 X / 公开发声节奏未拿到完整链路。


相关细分报告