AI 日报|2026-04-14
一句话结论:Anthropic Claude Mythos Preview 因自主发现数千个零日漏洞而限制公开发布,成为 frontier model 安全治理的标志性事件;OpenAI-Anthropic-Google 联合反模型复制、Qwen 3 系列密集开源、DeepSeek V4 即将发布构成本日多层信号交汇。
摘要
本日 AI 领域呈现三条主线交织:(1) Anthropic Mythos Preview 的安全限制发布引发行业关于 frontier model 治理边界的深度讨论,Fortune 报道聚焦"发现 vs. 修复"的真正瓶颈;(2) OpenAI、Anthropic、Google 通过 Frontier Model Forum 联合应对中国模型复制,供应链安全升维;(3) 开源生态中 Qwen 3 系列(72B dense + 235B MoE)密集发布,GLM-5.1 在 SWE-Bench Pro 登顶,开源与闭源的能力差距持续收窄。chips 层 NVIDIA Vera Rubin 平台七颗芯片全面量产,energy 层数据中心电力需求预测上调至 1,100 TWh/年。
Frontier Labs / Frontier Model Radar
Anthropic — Claude Mythos Preview(Project Glasswing)
- 核心事件:Anthropic 于 4 月 7 日发布其最强模型 Claude Mythos Preview(内部代号 Capybara),但仅通过 Project Glasswing 向约 50 家合作组织开放,不进行公开发布。这是近七年来首次有头部 AI 实验室以安全为由公开扣留模型。(InfoQ, NBC News)
- 能力跃升:SWE-bench Verified 93.9%(Claude Opus 4.6 为 80.8%),GPQA Diamond 94.6%;自主发现数千个零日漏洞,包括一个存在 17 年的 FreeBSD NFS 远程代码执行漏洞(CVE-2026-4747)。(red.anthropic.com, Help Net Security)
- Glasswing 合作方:AWS、Apple、Cisco、CrowdStrike、Google、JPMorgan Chase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networks。(Anthropic)
- 治理信号:Fortune 4/13 报道引述安全行业老兵观点——真正的瓶颈不是发现漏洞而是修复漏洞,Mythos 的发现能力远超当前修复管线的吞吐。(Fortune)
OpenAI — GPT-5.4 持续部署
- GPT-5.4(3/5 发布)持续铺开,100 万 token 上下文窗口、原生 computer use、SWE-bench Pro 57.7%、OSWorld 75%。mini/nano 变体已覆盖 free tier 和 API-only 场景。(OpenAI, TechCrunch)
- 营收信号波动:ARR 从 $25B 回落至 $24B,但仍在推进 IPO 准备。
Google DeepMind — Gemini 3.1 Ultra
- Gemini 3.1 Ultra 以原生多模态推理为卖点,与 GPT-5.4、Grok 4.20 同月密集发布。(Applying AI)
三巨头联合反模型复制
- Bloomberg 4/6 报道:OpenAI、Anthropic、Google 通过 Frontier Model Forum 共享情报,联合应对中国竞争对手从美国 frontier model 中提取结果的行为。(Bloomberg, Japan Times)
未验证 frontier 信号
- Anthropic Mythos 公开发布时间表仍未确认,市场预期与实际节奏存在不确定性。
- DeepSeek V4 Reuters 确认"数周内"发布,将运行于华为昇腾 950PR 芯片,但具体日期未定。
关键人物与社区信号
- Dario Amodei(Anthropic CEO):Fortune 4/13 专访中就 Mythos 安全限制发布做出公开解释,强调"能力与责任的平衡"。
- Sam Altman(OpenAI CEO):出现在关于 AI 恐惧的 Oscar 获奖导演纪录片采访中,与 Amodei、Hassabis 并列。(CNBC)
- Andrej Karpathy / Simon Willison / Shawn Wang:社区对 Mythos 安全限制发布的讨论活跃,但缺乏可独立验证的一手新增硬信号。
- 人物池增量判断:本日无需提名新候选人;现有 tracked people 的主要增量来自对 Mythos 事件的评论性信号,非结构性变动。
Energy
- IEA 预测上调:全球数据中心电力消耗 2026 年预计达 1,100 TWh,等同日本全国用电量,较 2025 年 12 月预测上调 18%。(Tech Insider)
- 自建电厂加速:微软与 Constellation Energy 签署至 2040 年的 2 GW 核电协议(史上最大企业核电协议);Google 与 Crusoe 确认在北德州建设 933 MW 天然气电厂。(TechCrunch)
- 电价传导:弗吉尼亚、德州、佐治亚数据中心集群周边居民电价已上涨 8–15%。
- 供应链隐患:Bloomberg 4/1 报道美国 AI 数据中心扩建依赖中国电气设备进口。(Bloomberg)
Chips
- NVIDIA Vera Rubin 量产:七颗新芯片全面量产——Vera CPU、Rubin GPU、NVLink 6 Switch、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6 Ethernet Switch,以及新集成的 Groq 3 LPU。(NVIDIA Newsroom)
- BlueField-4 推理存储:NVIDIA Inference Context Memory Storage Platform 发布,为 gigascale 推理加速,上下文高带宽跨集群共享,token/s 和能效提升最高 5x。(NVIDIA Newsroom)
- Meta 多年战略合作:NVIDIA 与 Meta 签署多年多代战略合作,涵盖本地、云和 AI 基础设施,部署百万级 Blackwell 和 Rubin GPU。(NVIDIA Newsroom)
- DeepSeek V4 走华为路线:DeepSeek V4 将运行于华为昇腾 950PR,标志中国 AI 芯片自主化的实质性进展。
Infra
- Google Cloud 率先支持 Vera Rubin NVL72:计划 2026 下半年成为首批提供 Vera Rubin NVL72 rack-scale 系统的云服务商。(Google Cloud Blog)
- Anthropic 基础设施营收拉动:Next Platform 4/7 分析 Broadcom 和 Google 因 Anthropic 增长(ARR 从 2 月 $14B 加速至 $30B)而显著受益。(Next Platform)
- AI coding 工具栈融合:Cursor、Claude Code、Codex 正在融合为统一的 AI coding 工具栈。(The New Stack)
Model
- Qwen 3 密集发布:Qwen 3 72B(4/5,dense,reasoning 优化)+ Qwen 3 MoE 235B(4/8,Apache 2.0)+ Qwen 3.6 Plus(4/2,hybrid 线性注意力 + sparse MoE)。
- GLM-5.1 开源登顶:智谱 AI GLM-5.1(4/7,MIT 协议)在 SWE-Bench Pro 上超越 Claude Opus 4.6 和 GPT-5.4。(What LLM)
- Mistral Small 4:119B/6.5B-active MoE,256K 上下文,统一推理/视觉/编码,Apache 2.0,API 价格 $0.15/M input tokens。Codestral 2 同步以 Apache 2.0 发布。
- DeepSeek V3.2 性价比:约 GPT-5.4 90% 性能,价格仅 1/50。
- xAI Grok 4.20:增强实时 web 访问的 flagship 模型;grok-code-fast-1 针对 agentic coding。
- 趋势判断:2026 年每个主要模型发布都强调 agentic 能力,纯文本 LLM 作为产品品类已终结,多模态为默认。
Application
- AI coding 市场格局:Anthropic 占企业 LLM API 支出 40%(OpenAI 从 2023 年 50% 降至 27%);Claude Code 以 46% “most loved” 评分居首。(Faros)
- Agentic 工作流实质化:Cursor 发布重构后的并行 agent 编排界面;OpenAI 发布可在 Claude Code 内运行的官方插件;三工具联合使用的早期采用者涌现。(The New Stack)
- 行业焦点从"AI coding assistant"转向"AI software developer":能够接受任务、分析代码库、规划、编写代码、运行测试并自我修复 bug 的完整工作流。
层间联动影响
- Model → Application 传导加速:Mythos 的 SWE-bench 93.9% 和 GPT-5.4 的 computer use 能力正在推动 agentic coding 从辅助走向自主执行,应用层市场份额重新洗牌。
- Chips → Infra → Model 链式推进:Vera Rubin 量产 + BlueField-4 推理存储 → 云服务商 rack-scale 系统上线 → 支撑更大规模推理负载(直接利好 Mythos/GPT-5.4 级别模型的部署成本下降)。
- Energy → Chips 供应链双向约束:数据中心电力需求上调叠加美国对中国电气设备进口依赖,形成 energy-chips 层间的地缘风险传导。自建电厂策略加速但仍无法覆盖 grid 缺口。
- Model 开源竞争 → 商业模型定价压力:GLM-5.1 MIT 许可超越闭源 benchmark + DeepSeek V3.2 1/50 价格 → 闭源 frontier model 的定价和差异化空间持续被压缩。
- 安全治理 → 全行业结构性变量:Mythos 限制发布 + 三巨头联合反模型复制 → 安全治理从边缘议题升级为影响模型发布节奏和竞争格局的核心变量。
候选池变化与后续关注
后续重点关注
- Anthropic Mythos 公开发布时间表:当前仅限 Glasswing 合作方,公开发布将重新定义 frontier model 的能力基准。
- DeepSeek V4 发布与华为昇腾 950PR 实测:中国 AI 芯片自主化的里程碑验证。
- Vera Rubin NVL72 云端上线:Google Cloud 等首批部署的实际性能和成本数据。
- 开源 benchmark 可信度:GLM-5.1 SWE-Bench Pro 登顶需要独立复现验证。
- 数据中心电力政策响应:8–15% 电价上涨引发的政策和监管反应。
候选池变化
- 本日无新增候选人提名。现有 tracked people 覆盖充分。
来源与交叉验证说明
来源构成:以 company/filing(OpenAI、Anthropic、NVIDIA、Google 官方博客和公告)为主体,辅以 media/analysis(Bloomberg、Fortune、TechCrunch、InfoQ、Next Platform),少量 community/social(开发者社区讨论)。
交叉验证:
- Mythos 安全限制发布:Anthropic 官方页面 + InfoQ + NBC News + Fortune + Help Net Security 多源交叉确认。
- 三巨头联合反模型复制:Bloomberg 首发 + Japan Times 独立报道确认。
- NVIDIA Vera Rubin 量产:NVIDIA Newsroom 官方 + Google Cloud Blog 合作方确认。
- Qwen 3 / GLM-5.1 发布:多个独立 LLM 追踪站点交叉确认。
- Energy 层数据:IEA 预测 + Bloomberg 供应链报道 + TechCrunch 具体项目报道交叉支撑。
coverage_gaps:
- 人物/社区层缺乏可独立验证的一手新增硬信号,主要为对 Mythos 事件的评论性内容。
- xAI Grok 4.20 的详细技术参数和独立 benchmark 验证不足。