[市场·2026-05-11] Frontier Radar

← 返回主报告:[市场·2026-05-11] Politics

Frontier Labs / Frontier Model Radar — 2026-05-11

总览

5/11 主线由 EU × frontier-AI 监管谈判 带动:OpenAI 公布 EU Cyber Action Plan,把 GPT-5.5 + GPT-5.5-Cyber 接入欧洲企业 / 政府 / EU AI Office 的 trusted-access 通道,与 Anthropic 仍以 Project Glasswing 把 Claude Mythos 卡在欧盟外形成强对比。OpenAI 并行落地 DeployCo(OpenAI Deployment Company)—— TPG 牵头、Advent / Bain / Brookfield 联席、BBVA 首批企业客户,初始 $4B / 全资本约 $10B,配套收购 Tomoro 凑齐 ~150 人交付队伍。Google DeepMind 同日发表 AI co-mathematician(Gemini 3.1 Pro 多代理工作台,FrontierMath Tier 4 48%),把 frontier-LLM 的 AI for Science 应用拉到 60 年 Kourovka 21.10 真解开盘。Meta Avocado 旗舰仍在 5 月窗口内打补丁,xAI / Mistral / DeepSeek / Qwen 5/11 当日无独立旗舰公告。

OpenAI

  • GPT-5.5 + GPT-5.5-Cyber EU 通路 — OpenAI 5/11 公布 EU Cyber Action Plan,把 GPT-5.5 与 GPT-5.5-Cyber 接入欧洲企业、政府、欧盟机构(含 EU AI Office)的 trusted-access 框架(身份验证 + 账户级控制 + 用途审批 + 监控分层)。GPT-5.5-Cyber 在限定预览下面向已审核红队 / 渗透 / 验证场景放开更宽容的安全任务行为,但 OpenAI 自评其在多数 cyber 评测上不会显著超越 GPT-5.5。(OpenAI, CNBC, EdTech Innovation Hub)
  • DeployCo 正式启动 — OpenAI 5/11 启动 OpenAI Deployment Company:OpenAI 控股,TPG 领投,Advent International × Bain Capital × Brookfield 联席 founding partner,BBVA 首批企业客户;初始投入 $4B+、整体规模约 $10B(Axios 标题口径 $14B 估值),约 150 人交付团队,同日收购咨询 / 工程公司 Tomoro 完成人员补强。(OpenAI, Axios, BBVA, TFN)

Anthropic

  • Mythos 欧盟门户仍未打开 — 5/11 报道:Anthropic 仍以 Project Glasswing 把 Claude Mythos Preview 限定在约 40 家美方司法管辖伙伴(Amazon / Apple / Google / Microsoft / Nvidia / JPMorgan / 等);欧盟委员会已与 Anthropic 开过 4-5 次会议但仍未给出预览路径,与 OpenAI 同日 GPT-5.5-Cyber EU 通路形成监管 / 供给二分;EU 内部 push ‘Mythos 在每个主要 OS / 浏览器上发现 0day,欧盟机构无视野’ 论调升级。(CNBC, TheNextWeb, Banking Exchange)

Google DeepMind

  • AI co-mathematician — 5/11 DeepMind 公布基于 Gemini 3.1 Pro 的层级多代理研究工作台:项目协调员 → 文献 / 库 / 反例 workstream 协调员 → 搜索 + 编码 + Deep Think 证明验证子代理;FrontierMath Tier 4 上 48 题答对 23 题(48% vs Gemini 3.1 Pro baseline 19% / Deep Think 70%),并辅助牛津拓扑学家 Marc Lackenby 攻下 1965 年起记录的 Kourovka Notebook 第 21.10 号开放群论问题。把 frontier-LLM 推向 AI for Science 真实开放问题侧。(The Rundown AI, OfficeChai, Abit.ee, 36Kr EU)

Meta

  • Avocado 5 月窗口 — 旗舰 Avocado 自 3 月被推迟到 5 月以来仍未 GA:内部测试推理 / 编码 / 写作落后 Google / OpenAI / Anthropic,定位在 Gemini 2.5–3.0 之间;5/11 当日无独立 Avocado GA 公告,仍有 Meta 高层讨论临时授权 Gemini 给 Meta 产品作过渡的传言(属 watchlist)。(TheNextWeb, MLQ, PYMNTS)

xAI

  • 沿用 Grok Connectors + Imagine Quality — 5/11 无独立模型公告;Grok Connectors(SharePoint / Outlook / OneDrive / Google Workspace / Notion / GitHub / Linear + BYO MCP)和 Grok Imagine Quality Mode 仍是当周公开节奏;Grok 4.3 仍是 4 月公开旗舰,Grok 5 ‘AGI roadmap’ 仍是叙事而非新模型节点。(Releasebot, xAI Docs)

Mistral

  • Medium 3.5 当周仍为最新 — 4/29 GA 的 128B dense MIT 模型(SWE-Bench 77.6% / τ³-Telecom 91.4%,$7.50 / M output token)仍是公开旗舰;Mistral Workflows 5/4-5/5 GA 沿用,5/11 未见 follow-up 博文。(RevolutionInAI, Codersera)

Qwen

  • Qwen 3.6 系列保持 — 5/11 无新公告:Qwen 3.6 27B(77.2% SWE-bench)+ Qwen 3.6 Max-Preview 仍是当周公开旗舰;Alibaba ‘关权一档’ 传言尚未被官方确认,需 watchlist 继续观察 Qwen 旗舰开源策略走向。(Codersera, Mean.CEO)

DeepSeek

  • V4 Pro + V4-Flash 持续 promo — 5/11 无新公告:V4 Pro(80.6 SWE-Bench Verified / 90.1 GPQA Diamond / 1M context)+ V4-Flash($0.14/M input、$0.28/M output)仍是公开旗舰,5/31 前 promo 价格未变;5/11 主要延续 V4 开源 SOTA 的对比叙事,没有新版本节点。(Codersera, TechCrunch)

未确认信号

  • DeployCo 估值锚 $14B vs $10B — Axios 5/11 标题口径 ‘valued at $14 billion’,但 Bloomberg / Marketscreener / OpenAI 官方均强调 ‘majority-owned by OpenAI、初始 $4B、整体 ~$10B 完全资本化’;$14B 估值锚未在 OpenAI 官方 PR 内确认。(Axios, Marketscreener, Bloomberg)
  • Meta ‘授权 Gemini 给 Meta 产品过渡’ — 仍是 PYMNTS / Fortune Tech / TechBuzz 转引层面,Meta 官方未做表态;watchlist 级别旗舰节奏指标。(PYMNTS, Fortune, TechBuzz)