[市场·2026-05-06] Frontier Radar

← 返回主报告:[市场·2026-05-06] Politics

Frontier Labs / Frontier Model Radar — 2026-05-06

5/5 是企业级 agent 平台与默认旗舰双线收紧的一天:OpenAI 把 GPT-5.5 Instant 直接装入 ChatGPT 默认槽位(52.5% 幻觉降幅 + 30% 篇幅压缩),Anthropic 同日在金融 + 创意双向放大 Claude 部署面(10 个金融 agent 模板、Microsoft 365 全家桶、Blender/Adobe/Autodesk/Ableton 创意 connector);前一日(5/4)Anthropic 与 OpenAI 同步公布 Wall Street 联合 venture,把企业部署外包给 alternative asset managers 的渠道战首次正式落地。

OpenAI

  • GPT-5.5 Instant 全量铺开为 ChatGPT 默认模型 + API chat-latest(5/5):高风险 prompt 幻觉降 52.5%、用户标记错误的难对话错误降 37.3%;输出 30.2% 更短 / 29.2% 更少行 / 显著减少 “gratuitous emojis”,记忆与 Gmail 个性化先 Plus/Pro,免费/Go/Business/Enterprise 数周内跟进;GPT-5.3 Instant 保留 3 个月。 (OpenAI 官方介绍 / System Card / TechCrunch)
  • ‘The Development Company’ $10B 联合 venture 最终化(5/4):从 19 家 alternative asset managers 募 $4B,TPG / Brookfield / Advent / Bain Capital 等列名;与 Anthropic 同日 venture 同构。 (Bloomberg / TechCrunch)

Anthropic

  • Claude Financial Services Agents — 10 个 ready-to-run 模板(5/5):pitchbook 构建、KYC 筛查、月末关账等;打包 skills + connectors + subagents;分发为 Claude Cowork / Claude Code 插件 + Claude Managed Agents cookbook;连入 FactSet / S&P Capital IQ / MSCI / PitchBook / Morningstar / Chronograph / LSEG / Daloopa + 新增 Verisk / Third Bridge / Fiscal AI / D&B / Experian / GLG / Guidepoint / IBISWorld。 (Anthropic 官 blog / Fortune / Bloomberg)
  • Microsoft 365 Add-ins 全家桶(5/5):Excel / PowerPoint / Word(Outlook 即将);上下文跨应用自动接力。Moody’s 数据合作同日宣布。 (Fortune / How2Shout)
  • Claude for Creative Work(5/5):新增 Blender / Adobe / Autodesk / Ableton / Splice 等 connector;引入 Claude Design 做创意构思与导出;自然语言驱动跨工具交接。 (Anthropic 官 blog)
  • $1.5B 企业 AI 服务公司联合 venture(5/4):Anthropic + Blackstone + Hellman & Friedman + Goldman Sachs 三方各 $300M;Apollo / General Atlantic / GIC / Leonard Green / Sequoia 跟投;定位向 PE 投后组合公司嵌入工程师重构工作流,明显切入传统咨询行业份额。 (CNBC / Blackstone 官公告 / Fortune)

Google DeepMind

  • Gemini Embedding 2 GA 上线 Gemini API + Vertex AI(5 月):首个原生多模态 embedding 模型,统一 text / image / video / audio / document 到单一向量空间;预览期已被电商发现引擎、视频分析等场景复现,多模态深度对标基准。 (Google blog GA / 模型介绍)
  • Google I/O 2026 5/19-5/20 定档(Mountain View):Gemini 4 / Veo 4 等下一代旗舰节点定档;本周(5/5-5/6)Pichai / Hassabis 无新公开发言,体现 ‘I/O 静默期’ 节奏。 (India News Network)

Meta

  • 无新增独立信号。Llama 4 Scout / Maverick(4/5 发布)维持已知公开旗舰状态;Llama 下一代权重时间表本日仍在传闻区。 (April 模型评论 - Sanjeev Patel)

xAI

  • Grok 4.20 Beta + Multi-agent Beta(Enterprise API);Grok Speech-to-Text / Text-to-Speech 独立 API(实时 + 批处理、多语种、说话人分离、时间戳、表达性 tag);Batch API 全用户、Grok Imagine API 端到端视频+音频生成。 (Releasebot xAI / xAI News)
  • OpenAI vs Musk 庭审进度(5/5):Brockman 反驳 Musk 创业史说法 + 复盘 Tesla 秘密项目;前序 4/30 Musk 作证承认 xAI 早期使用 OpenAI 模型训练 Grok。 (CNBC 5/5 / TechCrunch 4/30)

Mistral

  • 维持 Mistral Medium 3.5(4/29 发布,128B dense,77.6% SWE-Bench Verified)+ Mistral Large 3 / Small 4 已开 Apache 2.0;本日无新增独立信号。 (Revolution in AI / mistral.ai/news)

Qwen

  • 维持 Qwen 3.5 / 3.6 家族(dense 0.5B-32B + MoE 235B-A22B;3.6-27B SWE-bench Verified 77.2)—— Simon Willison 5 月通讯把其与 GPT-5.5 / ChatGPT Images 2.0 并列为本月开源主线;本日无独立官方更新。 (Simon Willison Substack / Codersera 对比)

DeepSeek

  • 维持 DeepSeek V4-Pro(1.6T/49B、1M context、$0.145/$3.48)+ V4-Flash 节奏;中文圈深度复盘已在 4/30 daily 完成,本日无新增独立信号。完整 paper 仍未发布。 (DeepSeek API Docs / Hugging Face 模型卡)

未验证 / 旁线信号

  • Microsoft Agent 365 GA(5/1)+ 5/5 Microsoft 365 Copilot ‘human agency’ 战略博文 — 不属于 8 大 frontier-lab 但是同期最直接对位 OpenAI / Anthropic 企业 agent 的非 OEM 信号。 (Microsoft Security blog / Microsoft 365 Copilot blog)
  • Mira Murati Thinking Machines Lab 据传以 $50B 估值在筹新一轮(Bloomberg 2026 早些报道):未在 5/6 当日有新公告,仍为 watchlist 噪声。 (Fortune)