← 返回主报告：[市场·2026-05-11] Politics

Frontier Labs / Frontier Model Radar — 2026-05-11

总览

5/11 主线由 EU × frontier-AI 监管谈判 带动：OpenAI 公布 EU Cyber Action Plan，把 GPT-5.5 + GPT-5.5-Cyber 接入欧洲企业 / 政府 / EU AI Office 的 trusted-access 通道，与 Anthropic 仍以 Project Glasswing 把 Claude Mythos 卡在欧盟外形成强对比。OpenAI 并行落地 DeployCo（OpenAI Deployment Company）—— TPG 牵头、Advent / Bain / Brookfield 联席、BBVA 首批企业客户，初始 $4B / 全资本约 $10B，配套收购 Tomoro 凑齐 ~150 人交付队伍。Google DeepMind 同日发表 AI co-mathematician（Gemini 3.1 Pro 多代理工作台，FrontierMath Tier 4 48%），把 frontier-LLM 的 AI for Science 应用拉到 60 年 Kourovka 21.10 真解开盘。Meta Avocado 旗舰仍在 5 月窗口内打补丁，xAI / Mistral / DeepSeek / Qwen 5/11 当日无独立旗舰公告。

OpenAI

GPT-5.5 + GPT-5.5-Cyber EU 通路 — OpenAI 5/11 公布 EU Cyber Action Plan，把 GPT-5.5 与 GPT-5.5-Cyber 接入欧洲企业、政府、欧盟机构（含 EU AI Office）的 trusted-access 框架（身份验证 + 账户级控制 + 用途审批 + 监控分层）。GPT-5.5-Cyber 在限定预览下面向已审核红队 / 渗透 / 验证场景放开更宽容的安全任务行为，但 OpenAI 自评其在多数 cyber 评测上不会显著超越 GPT-5.5。(OpenAI, CNBC, EdTech Innovation Hub)
DeployCo 正式启动 — OpenAI 5/11 启动 OpenAI Deployment Company：OpenAI 控股，TPG 领投，Advent International × Bain Capital × Brookfield 联席 founding partner，BBVA 首批企业客户；初始投入 $4B+、整体规模约 $10B（Axios 标题口径 $14B 估值），约 150 人交付团队，同日收购咨询 / 工程公司 Tomoro 完成人员补强。(OpenAI, Axios, BBVA, TFN)

Anthropic

Mythos 欧盟门户仍未打开 — 5/11 报道：Anthropic 仍以 Project Glasswing 把 Claude Mythos Preview 限定在约 40 家美方司法管辖伙伴（Amazon / Apple / Google / Microsoft / Nvidia / JPMorgan / 等）；欧盟委员会已与 Anthropic 开过 4-5 次会议但仍未给出预览路径，与 OpenAI 同日 GPT-5.5-Cyber EU 通路形成监管 / 供给二分；EU 内部 push ‘Mythos 在每个主要 OS / 浏览器上发现 0day，欧盟机构无视野’ 论调升级。(CNBC, TheNextWeb, Banking Exchange)

Google DeepMind

AI co-mathematician — 5/11 DeepMind 公布基于 Gemini 3.1 Pro 的层级多代理研究工作台：项目协调员 → 文献 / 库 / 反例 workstream 协调员 → 搜索 + 编码 + Deep Think 证明验证子代理；FrontierMath Tier 4 上 48 题答对 23 题（48% vs Gemini 3.1 Pro baseline 19% / Deep Think 70%），并辅助牛津拓扑学家 Marc Lackenby 攻下 1965 年起记录的 Kourovka Notebook 第 21.10 号开放群论问题。把 frontier-LLM 推向 AI for Science 真实开放问题侧。(The Rundown AI, OfficeChai, Abit.ee, 36Kr EU)

xAI

沿用 Grok Connectors + Imagine Quality — 5/11 无独立模型公告；Grok Connectors（SharePoint / Outlook / OneDrive / Google Workspace / Notion / GitHub / Linear + BYO MCP）和 Grok Imagine Quality Mode 仍是当周公开节奏；Grok 4.3 仍是 4 月公开旗舰，Grok 5 ‘AGI roadmap’ 仍是叙事而非新模型节点。(Releasebot, xAI Docs)

Mistral

Medium 3.5 当周仍为最新 — 4/29 GA 的 128B dense MIT 模型（SWE-Bench 77.6% / τ³-Telecom 91.4%，$7.50 / M output token）仍是公开旗舰；Mistral Workflows 5/4-5/5 GA 沿用，5/11 未见 follow-up 博文。(RevolutionInAI, Codersera)

Qwen

Qwen 3.6 系列保持 — 5/11 无新公告：Qwen 3.6 27B（77.2% SWE-bench）+ Qwen 3.6 Max-Preview 仍是当周公开旗舰；Alibaba ‘关权一档’ 传言尚未被官方确认，需 watchlist 继续观察 Qwen 旗舰开源策略走向。(Codersera, Mean.CEO)

DeepSeek

V4 Pro + V4-Flash 持续 promo — 5/11 无新公告：V4 Pro（80.6 SWE-Bench Verified / 90.1 GPQA Diamond / 1M context）+ V4-Flash（$0.14/M input、$0.28/M output）仍是公开旗舰，5/31 前 promo 价格未变；5/11 主要延续 V4 开源 SOTA 的对比叙事，没有新版本节点。(Codersera, TechCrunch)

未确认信号

DeployCo 估值锚 $14B vs $10B — Axios 5/11 标题口径 ‘valued at $14 billion’，但 Bloomberg / Marketscreener / OpenAI 官方均强调 ‘majority-owned by OpenAI、初始 $4B、整体 ~$10B 完全资本化’；$14B 估值锚未在 OpenAI 官方 PR 内确认。(Axios, Marketscreener, Bloomberg)
Meta ‘授权 Gemini 给 Meta 产品过渡’ — 仍是 PYMNTS / Fortune Tech / TechBuzz 转引层面，Meta 官方未做表态；watchlist 级别旗舰节奏指标。(PYMNTS, Fortune, TechBuzz)

Hanzhi's BLOG

[市场·2026-05-11] Frontier Radar