AI 日报｜2026-05-11｜OpenAI EU Cyber Action Plan + DeployCo × Anthropic Mythos 监管二分 × DeepMind AI co-mathematician

一句话结论：5/11 主线由 OpenAI 在欧盟 / 企业部署双线全力推进 与 Anthropic Mythos 仍受 Project Glasswing 限定 的对照撑住——OpenAI 同日落下 EU Cyber Action Plan（GPT-5.5 + GPT-5.5-Cyber 接入欧洲 trusted-access）+ DeployCo（OpenAI Deployment Company，$4B 初始 / ~$10B 整体，TPG/Advent/Bain/Brookfield 联席 + 收购 Tomoro 含 150 人交付队伍），与此同时 Google DeepMind 公布 AI co-mathematician（Gemini 3.1 Pro 多代理工作台，FrontierMath Tier 4 48%，攻破 1965 年 Kourovka 21.10）把 frontier-LLM 推到 AI for Science 真实开放问题侧。

摘要

5/11 AI 日报四条主线：

OpenAI 双线落地 — 同日推出 EU Cyber Action Plan（GPT-5.5 + GPT-5.5-Cyber 接入欧洲企业 / 政府 / 欧盟机构 trusted-access 框架）+ DeployCo（OpenAI Deployment Company，初始 $4B、整体 ~$10B，约 150 人交付队伍，同日收购 Tomoro 含 Mattel / Red Bull / Tesco / Virgin Atlantic 客户底，BBVA 首批企业客户）。
Anthropic Mythos × EU 监管对峙 — Anthropic 仍以 Project Glasswing 把 Claude Mythos 限定在约 40 家美方司法管辖伙伴；欧盟与 Anthropic 已开过 4-5 次会议但仍未给出预览路径，与 OpenAI EU 通路形成监管 / 供给二分。
DeepMind AI co-mathematician 发布 — Gemini 3.1 Pro 层级多代理工作台（项目协调员 → 文献 / 库 / 反例 workstream → 搜索 + 编码 + Deep Think 子代理），FrontierMath Tier 4 48%（vs Pro 19% / Deep Think 70%），辅助牛津 Marc Lackenby 攻破 Kourovka Notebook 21.10。
paper-digest 47 候选三源齐备 — Agent × Multimodal Search × Inference 加速三路撑起：DTap 红队平台（Percy Liang 署名）+ LLMs-Improving-LLMs（agentic TTS）+ HyperEyes / InterLV-Search 多模态代理搜索基准双信号 + SpecBlock +8-13% over EAGLE-3 + ReasonMaxxer RL-free 反命题。

Frontier Labs / Frontier Model Radar

5/11 主线由 EU × frontier-AI 监管谈判带动：OpenAI 公布 EU Cyber Action Plan，把 GPT-5.5 + GPT-5.5-Cyber 接入欧洲企业 / 政府 / EU AI Office 的 trusted-access 通道，与 Anthropic 仍以 Project Glasswing 把 Claude Mythos 卡在欧盟外形成强对比。Google DeepMind 同日发表 AI co-mathematician 把 frontier-LLM 的 AI for Science 应用拉到 60 年 Kourovka 21.10 真解开盘。Meta Avocado 旗舰仍在 5 月窗口内打补丁，xAI / Mistral / DeepSeek / Qwen 5/11 当日无独立旗舰公告。

OpenAI · GPT-5.5 + GPT-5.5-Cyber EU 通路 — 5/11 EU Cyber Action Plan：把 GPT-5.5 与 GPT-5.5-Cyber 接入欧洲企业、政府、欧盟机构（含 EU AI Office）trusted-access 框架（身份验证 + 账户级控制 + 用途审批 + 监控分层）。GPT-5.5-Cyber 限定预览面向已审核红队 / 渗透 / 验证场景放开更宽容的安全任务行为。(OpenAI, CNBC)
OpenAI · DeployCo 正式启动 — OpenAI 控股、TPG 领投、Advent × Bain × Brookfield 联席 founding partner、BBVA 首批企业；初始 $4B+、整体 ~$10B、约 150 人交付团队，同日收购咨询 / 工程公司 Tomoro 完成人员补强。(OpenAI, Axios, BBVA)
Anthropic · Mythos 欧盟门户仍未打开 — 5/11 报道：Anthropic 仍以 Project Glasswing 把 Claude Mythos Preview 限定在约 40 家美方司法管辖伙伴（Amazon / Apple / Google / Microsoft / Nvidia / JPMorgan 等）；EU 已开过 4-5 次会议但仍未给出预览路径。(CNBC, TheNextWeb)
Google DeepMind · AI co-mathematician — 5/11 公布基于 Gemini 3.1 Pro 的层级多代理研究工作台；FrontierMath Tier 4 上 48 题答对 23 题（48% vs Gemini 3.1 Pro baseline 19% / Deep Think 70%），并辅助牛津 Marc Lackenby 攻下 1965 年起记录的 Kourovka Notebook 21.10 号开放群论问题。(The Rundown AI, OfficeChai, arXiv 2605.06651)
Meta · Avocado 5 月窗口 — 旗舰仍处于 3 月被推迟到 5 月的窗口内：内部测试推理 / 编码 / 写作落后 Google / OpenAI / Anthropic，定位 Gemini 2.5–3.0 之间；5/11 无独立 GA 公告。(TheNextWeb, MLQ)
xAI / Mistral / Qwen / DeepSeek 5/11 无独立公告 — Grok Connectors + Imagine Quality Mode、Mistral Medium 3.5（4/29 GA）、Qwen 3.6 系列、DeepSeek V4 Pro/Flash promo 至 5/31 仍是当前公开旗舰。(Releasebot xAI, RevolutionInAI, Codersera)

未确认信号（watchlist）：

DeployCo 估值锚 $14B（Axios 标题）vs ~$10B 全资本化（Bloomberg / OpenAI 官方）口径未对齐。(Axios, Bloomberg)
Meta ‘临时授权 Gemini 给 Meta 产品过渡’ 仍是 PYMNTS / Fortune Tech / TechBuzz 转引，Meta 官方未表态。(PYMNTS, Fortune)

关键人物与社区信号

5/11 关键人物侧主线被 Google DeepMind AI co-mathematician 发布和 OpenAI EU Cyber Action Plan + DeployCo 同日落地撑住。

Pushmeet Kohli — 5/11 X 长帖宣布 GoogleDeepMind AI co-mathematician 发布；候选池 tracked_runtime 已有定位 AI for Science 主线话事人。
Sam Altman — 5/11 OpenAI DeployCo + EU Cyber Action Plan 双线公告；Musk v. Altman 周二持续高曝光。
Simon Willison — 4/30 GPT-5.5-Cyber 评测 + 5/6 Code w/ Claude SF 长记 + ‘agent 命名收敛’；5/11 EU Cyber Action Plan 把这条评测链推入主流监管延伸阅读。
Cat Wu — 5/6 Code w/ Claude SF 主线 PM 演讲（Claude Code 三层 surface + Routines + 子代理）+ Lenny’s Newsletter 长访谈 5/11 仍在 dev 社区扩散。
Ami Vora — 5/6 Code w/ Claude SF 主旨开场信号（Anthropic 整租 SpaceX Colossus 1 / API volume 17x 同比）5/11 仍作为 Anthropic-EU Mythos 谈判算力 × 用量背景被引用。
Andrej Karpathy — Sequoia Ascent fireside ‘从 vibe coding 到 agentic engineering’ 5/11 持续被引用；与 DeployCo × 企业 AI 部署主线形成宏观应用层叙事配合。
Amanda Askell / Boris Cherny — Anthropic 模型行为 + Claude Code 工程主线仍在 EU Mythos 谈判 / Anthropic 80x 增长报道（Fortune）背景内继续延伸。

Energy

数据中心电力瓶颈进一步硬化 — 约 11 GW 的 2026 计划数据中心容量仍停留在公告阶段未动工，全球 50% 项目因电网瓶颈延期；PJM Interconnection 自评 2027 缺口 6 GW；2023→2028 需求由 176 TWh 升至 325-580 TWh。Cleanview 2 月：30% 新增数据中心走 on-site 自发电（Oracle Project Jupiter 已切换到 100% Bloom 燃料电池微网），预测可升至 50%。(Common Dreams, Belfer Center, EnkiAI, Data Center Frontier)
SMR × AI 数据中心 5/6 双 MOU 在 5/11 当周延续 — Terrestrial Energy × Riot Platforms（核电大规模数据中心合作）+ NANO Nuclear × Supermicro（先进 microreactor 与 AI 服务器集成 MOU）；NRC 预计 2026 年签发首两张商业 SMR 建设许可，AWS $20B 投资宾州（含 Talen 现有核电站内新建 SMR 路径）继续推进。(Riot Platforms, NANO Nuclear, iRecruit)

Chips

三家继续分化 — NVIDIA Blackwell + Vera Rubin 2026-2027 计划销售约 $1T；Broadcom 继续靠定制 ASIC（XPU）与超大客户绑定，Q1 FY26 XPU 同比 +106%；AMD ‘Helios’ rack-scale（72 颗 MI450 Series GPU）定档 Q3 2026 部署。NVIDIA GTC（3 月）已确认 CPU 路线图（Vera）成为 AI 芯片下一阶段叙事核心。(Parameter, TipRanks, CNBC GTC)

Infra

Q1 2026 hyperscaler 增速继续分化 — Google Cloud +63% YoY 到 $20B、AWS +28%、Azure +40%；Amazon/Alphabet/Microsoft/Meta 四家 2026 capex 合计 $650-700B（约为 2025 双倍）。‘Magnificent Capex’ 当周报道（5/8）继续放大 AI infra 资本开支 × 财务回报的市场关注度，5/11 OpenAI DeployCo 把 $4B 初始 / $10B 整体级 enterprise 部署资本压进同一条赛道。(MindStudio, Tom Tunguz, Futurum, Ferguson Wellman)
Google / Microsoft 控制面叙事继续硬化 — Google 重新设计基础设施支撑 ‘persistent always-on agents’（与训练 next model 是根本不同工作负载）；Microsoft 5 月发布 Intelligent Purview 服务把 DLP 实时延伸到 AI prompt / response 层，明确把 enterprise agent 治理控制面做成 P&L 中心。(Google Cloud Blog, SiliconANGLE, Windows News)

Model

GPT-5.5 / GPT-5.5-Cyber × EU Cyber Action Plan vs Anthropic Mythos / Project Glasswing 二分 — 5/11 OpenAI 把 GPT-5.5 + GPT-5.5-Cyber 接入欧洲企业 / 政府 / 欧盟机构 trusted-access 框架，与 Anthropic 仍以 Project Glasswing 限定在美方司法管辖伙伴形成 EU 监管 / 美方供给二分；OpenAI DeployCo 同日落地把 $4B+ 部署资本压进 enterprise frontier 模型推广侧。(OpenAI, OpenAI DeployCo, CNBC)
Gemini 3.1 Pro × AI co-mathematician — Google DeepMind 5/11 公布多代理工作台，把 Gemini 3.1 Pro 推到 AI for Science 真实开放问题侧第一手公开案例（FrontierMath Tier 4 48% vs Gemini 3.1 Pro baseline 19% / Deep Think 70%）。(The Rundown AI, OfficeChai, arXiv 2605.06651)

paper-digest 5/11 直接消费（Top picks，model 层折叠）：

2605.04808 DecodingTrust-Agent Platform (DTap) — DTap 红队平台覆盖 14 领域 50+ 环境压测 AI 代理。
2605.08083 LLMs Improving LLMs: Agentic Discovery for Test-Time Scaling — 代理自动发现 TTS 策略，胜过人工启发式调度。
2605.06716 From Storage to Experience: LLM Agent Memory — Storage→Reflection→Experience 三阶段框架。
2605.06241 ReasonMaxxer (RL-free reasoning) — 熵门控对比损失替代 RL，单卡分钟级训练。
2605.07243 SpecBlock — 块迭代推测解码比 EAGLE-3 提速 8-13%（推理加速主线唯一硬 benchmark）。

Application

OpenAI DeployCo 正式启动 — 5/11 OpenAI 控股，约 150 人交付队伍（同日收购 Tomoro，含 Mattel / Red Bull / Tesco / Virgin Atlantic 客户底）、TPG/Advent/Bain/Brookfield 联席、BBVA 首批企业客户；目标是把 frontier 模型推到大型企业内部 ‘AI 部署工程师 + 客户团队’ 现场工作模式。(OpenAI, OfficeChai, Axios)
Healthcare × Finance enterprise AI 从 pilot 走到 production — 63% 医疗组织已用 AI、50%+ 报告 ≥2x ROI、平均 14 个月回本 $3.20/dollar；75% 美国医疗系统已用或将用 AI 平台，50% 已用 ≥3 应用。PwC × Anthropic 在 5 月扩张 Enterprise AI Plugins（首先 AI Native Finance + Healthcare & Life Sciences）。(Fierce Healthcare, PwC × Anthropic)

paper-digest 5/11 application 层 technical signals：

2512.18181 MACE-Dance — 级联 MoE 合成音乐驱动舞蹈视频（本周 MoE 主线首条具象化应用，HF rank 12 / 80 upvotes）。
2605.07177 HyperEyes — 把效率写进 RL 目标，多模态搜索改并行原子动作 + IMEB 基准 300 实例。
2605.07510 InterLV-Search — 首个交错多模态代理搜索基准。

层间联动影响

Energy × Infra × Application — 数据中心电力瓶颈 + on-site 自发电从 0% 升至 30% 趋势抬高 hyperscaler capex 单位发电成本，把 enterprise AI 部署侧（OpenAI DeployCo + PwC × Anthropic）推向 ‘推理 ROI 必须可量化’ 纪律；SpecBlock 类推理加速 +8-13% 直接转换为电费 / GPU-hour ROI 弹药。(Common Dreams, Futurum, OpenAI DeployCo, arXiv 2605.07243)
Model × Application × 监管 — OpenAI 把 GPT-5.5-Cyber 推进 EU trusted-access 与 Anthropic Mythos 仍由 Project Glasswing 限定在美方司法管辖伙伴的对照，把 frontier-cyber-AI 准入直接变成 EU 监管 / 美方供给二分；同时给企业 AI 部署侧（DeployCo / PwC × Anthropic）的合规 / 数据 residency 模板提供新坐标。(CNBC, OpenAI, TheNextWeb)
Chips × Model × Application — NVIDIA Vera Rubin 2026-2027 ~$1T × Broadcom XPU 定制 ASIC × AMD Helios MI450 三家分化 vs 5/11 DeepMind AI co-mathematician（Gemini 3.1 Pro 多代理）+ ReasonMaxxer ‘RL-free’ 反命题：如果推理 / 数学真能靠多代理 + RL-free + 推测解码硬抽到 +48% FrontierMath / +8-13% speedup，则下一代 chips 的 capex 投入产出比将被产品 / 应用层倒逼重定价。(TipRanks, The Rundown AI, arXiv 2605.06241)

🎙️ 播客动态

张小珺Jùn｜商业访谈录 — 140. 对姚顺宇的 4 小时访谈：请允许我小疯一下！在 Anthropic 和 Gemini 训模型、技术预测、英雄主义已过去 — 嘉宾姚顺宇（清华 + Stanford 物理博士），过去两年先后在 Anthropic、Google DeepMind 出任研究科学家，参与 Claude 3.7 / 4.5、Gemini 3 等关键模型开发；与同届清华校友姚顺雨（OpenAI → 腾讯，5/4/115 期）形成 ‘硅谷两 Yao’ 双线对照；访谈直话直说 ‘AI 个人英雄主义已过去’，提供来自模型训练一线的 Anthropic × DeepMind 节奏与文化对比观察。

候选池变化与后续关注

5/11 发现扫描产出 3 位新候选：

Mario Zechner（@badlogic，oss-ai-builders）— pi-mono / OpenClaw 引擎作者；pi-mono（44K+ stars、MIT、TypeScript monorepo：pi-ai / pi-agent-core / pi-coding-agent / pi-tui）继续作为 OpenClaw（250K+ stars）的底层 agent 引擎扩散；‘pi 不加 MCP / built-in todos / plan mode / background bash’ 的 minimalist 设计哲学（Implicator, Pocoo）是 OSS coding-agent harness 主线最纯粹的 4-tool 极简范式作者；推荐尽快入 tracked_runtime。
Daniel Zheng（ai-generalists）— AI Co-Mathematician 论文一作；与 Pushmeet Kohli / Alex Davies / Lars Buesing 等 18 人合著，把 Gemini 3.1 Pro 多代理工作台公开化，FrontierMath Tier 4 48% + Kourovka 21.10 真解；推荐尽快入 tracked_runtime。
Marc Lackenby（ai-generalists）— 牛津拓扑学家，用 Google DeepMind AI co-mathematician 攻下 Kourovka Notebook 21.10；‘初稿被审稿子代理标出逻辑缺口 → 人类研究者抓住底层策略 → 子代理重构完整证明’ 的人机协同链路是后续 AI for Science case-study 模板；建议入 candidate_queue。

后续关注：

DeployCo $14B vs $10B 估值锚口径对齐
Meta Avocado 5 月 GA 窗口内具体节奏
Anthropic Mythos 是否走欧盟单独 sandbox 时间表
xAI / Mistral / Qwen / DeepSeek 5 月后续旗舰节奏（5/11 全部 stale-day）

来源与交叉验证说明

来源混合：primary / official（OpenAI news、DeepMind Blog、Anthropic news、Google Cloud Blog、xAI Docs、arXiv、NRC、PJM、Belfer Center）；company / filing（NANO Nuclear、Riot Platforms、BBVA、HuggingFace Daily）；media / analysis（CNBC、Bloomberg、Axios、Fortune、MIT Tech Review、TechCrunch、TheNextWeb、Common Dreams、Reuters、Banking Exchange、Officechai、Implicator、TipRanks、Futurum、Tomasz Tunguz、Releasebot、Codersera、RevolutionInAI、Fierce Healthcare、PYMNTS、PwC press）；community / social（Simon Willison blog/substack、Karpathy bearblog、Lenny’s Newsletter、Pushmeet Kohli X、Mario Zechner blog/Pocoo、Abit.ee、TheRundown.ai、36Kr EU）。

交叉验证：OpenAI EU Cyber Action Plan 由 OpenAI 官方 + CNBC + EdTech Innovation Hub 三源；DeployCo 由 OpenAI 官方 PR + Axios + Bloomberg + Officechai + BBVA 多源；Anthropic Mythos EU holdout 由 CNBC + TheNextWeb + Banking Exchange 三源；DeepMind AI co-mathematician 由 The Rundown AI + OfficeChai + Abit.ee + Pushmeet Kohli X 多源 + 配套 arXiv 论文；paper-digest 5/11 47 候选三源齐备。

覆盖缺口：DeployCo 估值锚 $14B vs ~$10B 口径未对齐；Meta Avocado 5 月 GA 节奏未公开；EU Cyber Action Plan 已审核客户列表 / 单笔上限 / 期限未公开；Mythos 欧盟单独 sandbox 时间表未给；xAI / Mistral / Qwen / DeepSeek 5/11 当日 stale-day；paper-digest 自评 S2 相似论文链路全候选未返回；AI co-mathematician arXiv id 尚未进入 paper-digest top_picks（HF Daily cross-list 节奏滞后）；候选池 3 位新人物的 X / 公开发声节奏未拿到完整链路。

Hanzhi's BLOG

[市场·2026-05-11] AI