[市场·2026-04-15] AI

AI 日报|2026-04-15

一句话结论:Anthropic 以 Mythos Preview 开启网安专属前沿模型时代、Claude Code routines 推进自动化闭环;OpenAI 同日发布 GPT-5.4-Cyber 正面迎击;Google DeepMind 发布 Gemini Robotics-ER 1.6 将前沿模型嵌入物理世界——竞争主线从"谁更聪明"加速转向"谁先占领关键垂直场景"。

摘要

过去一周 AI 行业进入密集发布期。Anthropic 4 月 7 日公布 Claude Mythos Preview 并启动 Project Glasswing,将最强前沿模型限定于防御性网安用途,合作方涵盖 AWS、Apple、Google、Microsoft 等;4 月 14 日又发布 Claude Code routines(云端自动化)和桌面端大改版。OpenAI 同期推出 GPT-5.4-Cyber、新 $100/月 Pro 套餐及 GPT Image 2。Google DeepMind 4 月 14–15 日发布 Gemini Robotics-ER 1.6 并与 Boston Dynamics 集成。Meta 发布首个专有模型 Muse Spark,标志开源路线出现分化。xAI Grok Computer agent 进入公测。Qwen 3.6 Plus 已上线,DeepSeek V4 完整版仍在等待。基础设施层面,Big Tech 合计 capex 接近 $7000 亿,NVIDIA 与 OpenAI 签署 10GW 级部署协议。

Frontier Labs / Frontier Model Radar

Anthropic — Claude Mythos Preview & Project Glasswing

  • Mythos Preview 于 4 月 7 日公布,为通用模型但在网安任务上表现突破性,内测中自主发现并利用所有主流操作系统和浏览器的零日漏洞,包括一个存在 27 年的 OpenBSD 漏洞(Anthropic 官方Fortune 报道)。
  • 模型不会公开发布。通过 Project Glasswing 向 AWS、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Microsoft、NVIDIA 等提供防御性安全访问(InfoQ)。
  • UK AISI 完成独立评估,确认攻击能力显著但也指出局限性(AISIHelp Net Security)。
  • Fortune 报道业界对漏洞发现与修复速度不对称的担忧——“发现不是瓶颈,修复才是”(Fortune)。

Anthropic — Claude Code routines & 桌面端重设计

  • 4 月 14 日发布 Claude Code routines:保存 prompt + repo + connectors 配置后可在 Anthropic 云端自动执行,关掉笔记本也能运行。Pro 限 5 次/天,Max 15 次,Team/Enterprise 25 次(SiliconANGLE官方博客)。
  • 桌面端新增内置终端、更快 diff viewer、应用内文件编辑器和扩展预览区,减少编辑器切换(官方博客)。

Anthropic — 用户性能感知下降争议

  • Fortune 报道 Anthropic 面临大量用户对 Claude 模型性能下降的反馈,与近期调整默认 effort 级别以节省 token 有关,公司估值 $3800 亿、IPO 在即(Fortune)。

OpenAI — GPT-5.4-Cyber & 新套餐

  • GPT-5.4-Cyber 开始向 Trusted Access for Cyber 计划参与者有限推出,专注软件漏洞发现,与 Anthropic Mythos 直接竞争(BloombergAxios)。
  • 新 $100/月 ChatGPT Pro 套餐(介于 $20 Plus 与 $200 Pro 之间),主打 5x Codex 用量,上线促销期 10x(The Next Web)。
  • GPT Image 2 开始灰度推送,文字渲染和 prompt 遵从度提升(mejba.me)。

Google DeepMind — Gemini Robotics-ER 1.6

  • 4 月 14–15 日发布 Gemini Robotics-ER 1.6,专为物理环境自主机器人设计,新增仪表读数能力,可解读模拟仪表和液位计(DeepMind 官方MarkTechPost)。
  • 与 Boston Dynamics 合作将 Gemini 集成至 Spot 工业巡检平台(Robotics & Automation News)。
  • 通过 Gemini API 和 Google AI Studio 向开发者开放。

Meta — Muse Spark 专有模型

  • 4 月 8–9 日发布 Muse Spark,由 Alexandr Wang 领导的 Meta Superintelligence Labs 主导,为 Meta 首个完全专有模型,标志开源路线出现重大分化(CNBC)。
  • 2026 年 AI 相关 capex 指引 $1150–1350 亿,接近去年两倍(CNBC)。
  • LlamaCon 4 月 29 日举行;Llama 4 Scout/Maverick 已上线。

xAI — Grok 4.20 Beta 2 & Grok Computer

  • Grok 4.20 Beta 2 在医疗、法律推理和通用 benchmark 上领跑,声称超越 Claude Opus 4.6、GPT-5.4 和 Gemini 3.1 Pro(IBTimes)。
  • Grok Computer agent 私测已开放,可全面控制桌面应用(DEXTools)。
  • XChat(WeChat 竞品)预计 4 月 17 日上线,Grok 为底层引擎。
  • Apple 因 deepfake 问题威胁将 Grok 下架 App Store(NBC News)。

Qwen — Qwen 3.6 Plus

  • 4 月 2 日发布 Qwen 3.6 Plus,混合线性注意力 + 稀疏 MoE,1M token 上下文,always-on CoT,agentic coding 得分超 Claude Opus 4.5(Particula)。
  • 一周内连发三个模型(含 Qwen3.5-Omni),Alibaba 在开源模型 Hugging Face 下载量已超 Meta Llama。

DeepSeek — V4 仍未完整发布

  • DeepSeek V4 Lite(~200B 参数)3 月 9 日已发布,完整 1T 参数版本 4 月仍为预期窗口但尚未落地(Particula)。
  • 中国开源模型合计已占全球聚合平台用量约 30%。

关键人物与社区信号

  • Andrej Karpathy 转发并放大 Simon Willison 关于 prompt injection 的安全警告,将当前状态类比为早期计算机病毒时代(X.com)。
  • Simon Willison 发文指出 OpenAI Advanced Voice Mode 在基础问题上表现远弱于文本模型,凸显"同一公司不同模态能力鸿沟"(simonwillison.net)。
  • 社区对 Anthropic effort 级别调整引发的性能感知下降讨论持续升温,Fortune 进行了专题报道。
  • 无高置信度新增候选人物。

Energy

  • NVIDIA 与 OpenAI 签署 10GW 级 NVIDIA 系统部署协议,首批 1GW 基于 Vera Rubin 平台于 2026 年下半年部署,NVIDIA 承诺逐步投入最高 $1000 亿(NVIDIA Newsroom)。
  • Vera Rubin 平台引入全液冷方案(温水散热),降低冷却能耗(NVIDIA GTC 2026 报道)。
  • 欧洲绿色能源新规正迫使数据中心运营商转向更高效硬件,对 NVIDIA H200/Rubin 架构形成利好。
  • 本地监管阻力和基础设施瓶颈仍是行业扩张的关键约束(MIT Technology Review)。

Chips

  • NVIDIA Vera Rubin 平台发布六款新芯片及 AI 超算,Google Cloud 将成为首批提供 Vera Rubin NVL72 机架系统的云商(NVIDIA NewsroomGoogle Cloud Blog)。
  • Intel 与 Google 扩大定制 ASIC IPU 联合开发,重点放在网络/存储/安全卸载以提升超大规模环境利用率(Intel NewsroomTechCrunch)。
  • AI 数据中心 GPU 市场报告预测规模达 $323 亿(GlobeNewsWire)。
  • Lite-On 展示基于 Vera Rubin 的 800V DC 供电机架和 110 kW 功率架构。

Infra

  • Big Tech 四巨头(Amazon、Google、Meta、Microsoft)2026 年合计 AI infra capex 接近 $7000 亿:Amazon ~$2000 亿,Google ~$1750–1850 亿,Meta ~$1150–1350 亿(Tech Insider)。
  • 世界经济论坛呼吁将 AI 基础设施纳入关键基础设施保护框架(WEF)。
  • Google Cloud 首批上线 Vera Rubin NVL72 和 RTX PRO 6000 Blackwell 分式 VM(Google Cloud Blog)。
  • Amazon EC2、Azure VM、Google Cloud 被 Info-Tech 评为 2026 Cloud IaaS Champions。

Model

  • 本周模型层最大变量是网安专用前沿模型作为新品类出现:Anthropic Mythos Preview 和 OpenAI GPT-5.4-Cyber 几乎同步发布,标志头部厂商从通用智能竞赛转向高价值垂直能力竞赛。
  • Grok 4.20 Beta 2 在多项 benchmark 上声称领先,但需注意 xAI benchmark 自报结果尚缺第三方独立验证。
  • Qwen 3.6 Plus 在 agentic coding 上展示强竞争力,中国开源模型阵营市场份额持续扩大。
  • DeepSeek V4 完整版延迟仍为不确定因素。
  • Meta Muse Spark 专有化转向值得关注——若持续,开源生态格局会发生结构性变化。

Application

  • Claude Code routines 将 agentic coding 从"人工触发"推向"配置化自动执行",是 developer tooling 自动化的关键一步。Pro/Max/Team/Enterprise 均可使用,执行在 Anthropic 云端。
  • Grok Computer agent 进入私测,实现全桌面操控。若 XChat 4 月 17 日按期上线,xAI 将成为同时拥有 agent + 超级应用 + 前沿模型的少数玩家之一。
  • Gemini Robotics-ER 1.6 + Boston Dynamics 将前沿模型能力直接嵌入工业巡检场景,是 AI-物理世界集成的具象化案例。
  • OpenAI 企业收入占比超 40%,agent 已进入流程级部署;Codex 周活 300 万,API 每分钟超 150 亿 token。
  • GPT Image 2 灰度上线,文字渲染提升可能影响设计工具市场。

层间联动影响

  1. Chips → Infra → Energy 正循环加速:NVIDIA-OpenAI 10GW 协议 + Vera Rubin 液冷 + Big Tech ~$7000 亿 capex 形成从芯片到电力的完整扩张链条,但本地监管和电网瓶颈可能成为实际交付的卡点。
  2. Model → Application 垂直化加速:Mythos Preview 和 GPT-5.4-Cyber 同步出现表明,前沿模型的差异化竞争正从通用 benchmark 转向"谁能在特定高价值领域(网安、robotics)率先形成闭环"。
  3. Application → Model 反馈:Claude Code routines 和 Grok Computer 代表两种不同的 agent 自动化路径——服务端 vs 客户端。两条路线都在收集真实用户工作流数据,将反哺下一代模型训练。
  4. 开源生态分化信号:Meta Muse Spark 专有化 + Qwen/DeepSeek 持续开源扩张,开源 AI 领导权正在发生转移。

候选池变化与后续关注

  • 无新增候选人物。本周高价值信号主要来自公司管理层和产品发布,社区层未出现需要晋升或新增的个人。
  • 后续观察点
    • Anthropic Mythos Preview 的 Project Glasswing 合作方是否会发布独立安全评估结果
    • DeepSeek V4 完整版何时落地
    • Meta 是否持续走专有路线,还是 LlamaCon 上宣布开源新计划
    • XChat 4 月 17 日上线后的实际产品形态
    • Claude Code routines 使用量和留存数据
    • NVIDIA-OpenAI 10GW 首批 1GW 的实际部署进展

来源与交叉验证说明

Source mix: 本报告以 company / filing(Anthropic、OpenAI、Google DeepMind、Meta、NVIDIA 官方博客及 SEC 文件)和 media / analysis(Bloomberg、Fortune、CNBC、TechCrunch、Axios)为主,辅以 community / social(Simon Willison、Andrej Karpathy)。UK AISI 评估报告提供 primary / official 交叉验证。

Verification note: Mythos Preview 能力声明来自 Anthropic 官方 + UK AISI 独立评估交叉验证;GPT-5.4-Cyber 目前仅有 Bloomberg/Axios 媒体报道 + OpenAI 有限披露;Grok 4.20 benchmark 为 xAI 自报、缺第三方验证;Big Tech capex 数据来自各公司财报指引和多家媒体交叉确认。DeepSeek V4 完整版发布窗口为社区预期而非官方确认。