[市场·2026-05-03] Frontier Radar

Frontier Labs / Frontier Model Radar — 2026-05-03

48 小时内的主线信号有三块:(1) OpenAI 仍被 Musk v. Altman 一审的 7 小时证词主导(CNBC 5/2 周回顾MIT TR 5/1 Week 1),与 4/27 的 Microsoft-OpenAI 重谈 形成"商业松-法庭紧"的同框;(2) DeepSeek V4-Pro 拿到 NIST CAISI 5/1 官方评估,被定位为"落后前沿约 8 个月、目前最强中国模型",立即被 Techmeme 5/3 推上首页;(3) Mistral 5/2 在 MarkTechPost 完成 Medium 3.5 + Vibe 远程 agent 的二次推介(SWE-Bench Verified 77.6%),把 4/29 的 Le Chat 默认模型升级转化为开发者侧叙事。Anthropic / Google DeepMind / Meta / xAI / Qwen 当日无新一线产品级动作,皆为存量信号延伸。

OpenAI

  • Musk v. Altman Week 1 收官(5/1–5/2):Musk 在加州奥克兰联邦法院 7 小时证词跨 3 天,承认 xAI “部分使用 OpenAI 模型蒸馏 Grok”,主张"You can’t just steal a charity",请求法院罢免 Altman / Brockman 并撤销 OAI for-profit 子公司重组;Judge Gonzalez Rogers 已把审判分为 liability + remedies 两阶段,liability 预计 5/21 前结案,陪审团裁决仅供参考。(MIT TR 5/1; CNBC 5/2)
  • MS 协议次生效应(持续):4/27 Microsoft–OpenAI 调整后,Azure 仅"主云"非"独家"、MSFT 对 OAI IP 许可改非独占且不再付分成、OAI 分成至 2030 但加总额上限 — Motley Fool 5/1 解读为 MSFT 长期摊薄、OAI 多云空间打开,与 Musk 案同期形成"商业松-法庭紧"。(OpenAI 公告; Motley Fool 5/1)

Anthropic

  • 存量主线:Opus 4.7 4/16 GA(同价 $5/$25,cyber 能力低于 Mythos Preview 但安全护栏增强)+ Project Glasswing 11 家关键基础设施公司联盟仍在生效,5/3 当日无新 Anthropic 产品发布。(Opus 4.7 公告; Project Glasswing)

Google DeepMind

  • Gemini 进车(4/30):与 GM 合作,Gemini 将分发到约 400 万辆 2022 MY 起的 Cadillac/Chevrolet/Buick/GMC 车型替换 Google Assistant — 是 Deep Research Max(4/21)+ Gemini Robotics ER 1.6 之后的第三轮存量分发战。(TechCrunch 4/30; Deep Research Max 公告)

Meta

  • 存量主线:4/8 推出 Muse Spark(多模态推理 + Contemplating 多 agent 并行模式,HLE 58% / FrontierScience 38%),完全闭源、API 仅私测、Llama 4 之后已无新开权重路线 — 5/3 当日无新动作。(about.fb 公告; VentureBeat 4/8)

xAI

  • Musk 证词外溢(5/1):xAI 首次官方层面承认 Grok 训练"部分依赖 OpenAI 模型蒸馏",技术 narrative 从"自研 frontier"转向"快速跟进者"。Voice Mode 进 Apple CarPlay 与 SpaceX 6 月 IPO(目标估值 $1.75T)为后续叙事点。(TechCrunch 4/30; LatestLY)

Mistral

  • Medium 3.5 + Vibe 二次推介(5/2):MarkTechPost 把 4/29 发布的 dense 128B / 256K context / 单权重融合 chat+reasoning+code 模型 SWE-Bench Verified 77.6% 这一数字推到开发者社区前台;Vibe 远程 agent 在 GitHub / Slack 沙箱里跑 bug 修复成为"agentic Medium 3.5"卖点。(MarkTechPost 5/2; Mistral 公告)

Qwen

  • 存量主线:Qwen 3.5(397B MoE / 256K / 201 语言 / 视觉)2/16 Apache 2.0 发布后无新一代旗舰,5/3 当日无新动作。(Qwen 3.5 概览)

DeepSeek

  • NIST CAISI 5/1 官方评估:DeepSeek V4-Pro 在 cyber / SWE / 自然科学 / 抽象推理 / 数学 5 域 benchmarks 表现"约等于 8 个月前的 GPT-5",但在 7 项基准里 5 项比 GPT-5.4 mini 更具成本效率,被定为"目前最强中国 PRC 模型"。这是一个对国内 narrative (“V4 已追平 Opus 4.6”)的官方下修信号;与 75% off 促销至 5/31 形成"价格松-能力收"的对照。(NIST 5/1; Techmeme 5/3)

Unverified / watchlist

  • OpenAI AI-native 智能手机原型:MarketingProfs 5/1 提及 OpenAI 正在打造"以 agent 取代 app"的设备原型,无官方 confirm,仅二手综述层。归 watchlist。(MarketingProfs 5/1)
  • xAI / SpaceX 6 月联袂 IPO 估值 $1.75T:仅 Musk 公开口风 + 二手报道,无 S-1,归 watchlist。(Grok 5 月综述)