AI 日报|2026-04-30
一句话结论:DeepSeek V4 发布一周后中文一线技术圈完成首轮深度复盘,Google Cloud Next 把"agent 时代"做成顶层叙事,Anthropic Mythos/Project Glasswing 的安全张力延烧到第三方供应链——前沿模型成本、企业 agent 平台与零日漏洞外溢三条主线同时收紧。
摘要
- 4/30 中文 AI 圈第一波 DeepSeek V4 深度访谈出炉(晚点聊 163 期):定位"沿 R1 测试时扩展范式做组合创新",编程能力对御三家仍有差距,FP4+Muon+mHC+新注意力四个新 feature 耦合是延期主因。
- Google Cloud Next '26 落幕:Vertex AI 改名 Gemini Enterprise Agent Platform,A2A 协议产品化,Workspace 加 Agent Designer / Inbox / Skills / Projects;Thomas Kurian 给出"the era of the pilot is over, the era of the agent is here"主旋律。
- OpenAI Workspace Agents 仍处研究预览免费窗口(截至 5/6),4/28 面向教育线开放专场培训;Salesforce 同步推出 Headless 360 把整个平台开放给 Claude Code / Cursor / Codex / Windsurf 直连。
- Anthropic Mythos 经第三方供应商 URL 命名规则反推被 Discord 圈外泄事件持续发酵:4/29 Cybernews 与 hipther 网络安全周报正式定性"first-known frontier model unauthorized access",Project Glasswing 50 家伙伴名单(含 AWS/Apple/Cisco/CrowdStrike/JPMC/Linux Foundation)成为对照参照系。
- 能源-芯片瓶颈进一步硬化:IEA 全球数据中心 2026 用电预测从 12 月份的 935 TWh 上修至 1,100 TWh;SMR 离网协议储备由 2024 年底 25 GW 升至 45 GW;TSMC CoWoS 与 HBM4(SK Hynix 锁 70% 初始产能)2026 全年售罄。
Frontier Labs / Frontier Model Radar
- DeepSeek V4-Pro / V4-Flash(4/24 发布,4/30 中文圈深度复盘)
- V4-Pro:1.6T 总参 / 49B activated / 33T tokens 预训练 / 1M context;V4-Flash:284B 总参 / 13B activated;MIT 协议,Hugging Face 公开权重(DeepSeek API Docs)。
- 架构组合:Hybrid Attention(Compressed Sparse Attention + Heavily Compressed Attention)、Muon 优化器、mHC(Manifold-Constrained Hyper-Connections)、FP4 训练 / 推理;1M 上下文下 V4-Pro 单 token 推理 FLOPs 仅 V3.2 的 27%、KV cache 仅 10%(Hugging Face Model Card)。
- 定价:Pro $0.145/$3.48 per M token,Flash $0.14/$0.28——Pro 全面低于 GPT-5.5 / Claude Opus 4.7 / Gemini 3.1 Pro / GPT-5.4;Flash 比 GPT-5.4 Nano 还便宜(Simon Willison 4/24 复盘)。
- 能力定位:agentic 基准与 GPT-5.5 / Opus 4.7 同档,落后 GPT-5.4 / Gemini 3.1 Pro 约 3-6 个月;编程能力与"御三家"仍有可感差距(晚点聊 163 期 DeepSeek V4 深度访谈)。
- 硬件适配:Pro 模型同步绑定华为昇腾 910C / 950PR 推理路径;不再披露训练成本——“用模型能力说话”。
- Anthropic Mythos / Project Glasswing(4/7 启动,4/22-29 失控外泄)
- Project Glasswing 官方伙伴扩至 50+:AWS / Apple / Broadcom / Cisco / CrowdStrike / Google / JPMorganChase / Linux Foundation / Microsoft / NVIDIA / Palo Alto Networks(Anthropic 官网)。
- 4/29 Cybernews 复盘:Discord 模型追踪私圈通过 Mercor 数据泄露 + 第三方承包商凭据 + URL 命名规律反推出 Mythos preview 端点,自 4/7 公告日起持续访问至今未被切断(Cybernews Anthropic Mythos,Fortune Mythos Leak)。
- Mythos 自身能力:测试期发现 OpenBSD 27 年历史漏洞、FFmpeg 16 年历史漏洞、FreeBSD NFS 17 年 RCE,触发 Anthropic ASL-4。
- OpenAI GPT-5.5 + Workspace Agents(4/22-24 发布,4/28 教育线培训)
- GPT-5.5 已铺满 Plus/Pro/Business/Enterprise;Workspace Agents 进入研究预览,5/6 起转 credit-based 计费;4/28 Build Hour 面向 Edu / Teachers 教师线开放(OpenAI Workspace Agents,VentureBeat 报道)。
- GPT-5.4-Cyber 通过受控渠道供联邦机构和五眼联盟使用,对位 Mythos Glasswing 模式。
- Google Gemini Enterprise + Cloud Next '26(4/22-24 大会,4/29 中文播客现场总结)
- Vertex AI rebrand → Gemini Enterprise Agent Platform;Agentspace 并入 Gemini Enterprise;新增 Agent Designer、Inbox、Skills、Projects、长程 agent 与 200+ 模型仓(含 Anthropic Claude);Project Mariner web-browsing agent、Agent2Agent (A2A) 协议产品化、托管 MCP server(Google Cloud Next 总结,Stratechery 与 Kurian 访谈)。
- Kurian 关键定性:“the era of the pilot is over, the era of the agent is here”;Google 押注全栈四层(Ironwood TPU + Gemini 模型 + Cloud + Workspace 30 亿用户分销)(BizTech Magazine)。
- Google → Anthropic:4/24 宣布 up to $40B 现金 + 算力联合投资(TechCrunch)。
- 未验证 / 观察名单:xAI Grok 4.20 Beta 2 仍是公开旗舰,4/30 无新增信号;Meta 公开 Llama 下一代权重时间表仍在传闻区;MiniMax M2.7 self-evolving 能力 4/13 发布后未被独立复现。
关键人物与社区信号
- Simon Willison(4/24 长文):把 V4-Pro 直接定位为"开放权重新王",体量超过 Kimi K2.6 (1.1T) 与 GLM-5.1 (754B),并指出 V4-Flash 是 sub-tier 中最便宜的开源模型,可与 GPT-5.4 Nano 直接对比性价比(Simon Willison 4/24 博文)。
- Sebastian Raschka(X.com 持续追踪):在 V4 发布前一天还在比较印度 Sarvam 30B/105B 两款新开源模型——“Sarvam 30B 仍用经典 GQA、105B 用了新型注意力”——为 V4 当周技术对比铺线(Sebastian Raschka X 帖)。
- Andrej Karpathy:自 4/23 起的 agent / 编码论断(“编码 agent 已跨过质变门槛”)经多次中文圈引用为 V4 / GPT-5.5 共同语境;4/30 暂无新增独立信号。
- Thomas Kurian / Ben Thompson:Stratechery 4/23 长访谈成为 Cloud Next 战略解读模板,多家分析媒体在 4/29-30 引用 Kurian “intelligence + automation = value, intelligence from data, automation from agents” 的公式(Stratechery 访谈)。
- Anthropic 内圈反应:Boris Cherny、Alex Albert 在 Mythos URL 外泄事件中保持产品端发言克制;Anthropic 官方维持"Mythos 不公开发布、走 Glasswing 联盟"立场,CEO Dario Amodei 公开表示外泄是 Anthropic 第三方供应商凭据问题、不直接由 Anthropic 内部凭据外流引发(Fortune Dario 表态)。
- 新候选人扫描(详见末尾"候选池变化与后续关注"):本日新增 3 名候选人——Liang Wenfeng(DeepSeek 创始人、V4 核心架构作者)、Logan Kilpatrick(Google AI Studio / Gemini API 产品负责人)、Wenting Zhao(Qwen 研究科学家)。
Energy
- IEA 4 月数据更新:2026 全球数据中心电力消耗预测从 2025 年 12 月的 935 TWh 上修至 1,100 TWh,相当日本全国年用电;其中 AI 专属数据中心子集增速明显高于全球电力 3% 增速(IEA 数据中心更新)。
- 美国互联调度:4 月美国各 RTO 公开数据显示,单个 hyperscaler 园区 1-2 GW 接入排队时间已普遍突破 5 年;公用事业宣布 $1.4T 多年支出计划仍难短期补齐(Tech Insider)。
- SMR 离网协议储备:从 2024 年底 25 GW 上升至 45 GW;微软 2 GW Constellation 协议(至 2040)目前仍是单笔最大企业核电承购,多家科技公司合计 SMR 财务承诺已超过 20 GW(IAEA SMR 评估)。
- 影响判断:能源端硬约束已在 4/30 时点定型——所有 frontier lab 能力扩展节奏,未来 12 个月将受供电接入而非 GPU 数量直接限制。
Chips
- TSMC CoWoS-L 路径:Nvidia Blackwell 后续封装锁定大部分 CoWoS-L 产能;2024 末 ~35K wafer/月 → 2026 末目标 130K wafer/月,期间外溢 ASE / Amkor 做次级工序(CNBC 报道)。
- HBM4 供应:2026 全年售罄;SK Hynix 拿下约 70% 初始产能,Samsung / Micron 抢夺剩余份额;Micron HBM 全年订单已饱和(Yahoo Finance)。
- DRAM 涨价:HBM 占用 wafer 与 advanced packaging,外溢推高 DDR5 PC / 服务器内存价格——半导体业内估算 2026 DRAM ASP 上行 50% 区间(KAD 半导体行业评估)。
- 中国侧:DeepSeek V4-Pro 显式标注昇腾 910C / 950PR 部署路径;Mythos 案例反向证明国产推理算力对开源大模型的承接价值。
- 影响判断:CoWoS + HBM4 双瓶颈使 2026 年内任何"再加一倍 GPU 集群"提案都需提前 12-18 个月锁定供应,新进入者尤其受限。
Infra
- Google Cloud Next '26 全栈 Agent Platform:Vertex → Gemini Enterprise Agent Platform;Agent Designer / Inbox / Skills / Projects;A2A 协议产品化;托管 MCP server;200+ 模型仓含 Anthropic Claude(Google Cloud Next 26 公告)。
- OpenAI Workspace Agents:研究预览中、5/6 转计费;可直接接入 Slack / Salesforce / 第三方系统,被 VentureBeat 定性为 “custom GPT 的企业级继任者”(VentureBeat 报道)。
- Salesforce Headless 360:把全平台暴露成 API / MCP / CLI,60+ 新 MCP 工具 + 30+ 预配置 coding skill,原生兼容 Claude Code / Cursor / Codex / Windsurf;Agentforce Operations 同步面向后台流程铺开(VentureBeat,Salesforce 公告)。
- Microsoft Agent Framework 1.0:稳定 API + 长期支持承诺,原生 MCP,DevUI 可视化 agent 执行轨迹;与 Salesforce / OpenAI / Google 形成"四家同时把 agent 平台做到 1.0"局面。
- MCP 生态:Google + Salesforce + Microsoft + OpenAI 同期把 MCP 当成跨厂商 agent 互通底座;A2A(Agent-to-Agent)开始进入产品级 SLA。
- 影响判断:4/30 的 infra 层已从"做工具"切换到"做平台"——MCP / A2A 成 agent 时代的事实标准协议,单点 SaaS 与单点框架快速被吞食。
Model
- DeepSeek V4 = 当周开放权重最强、且最便宜的前沿模型(详见 Frontier Radar)。重要的是其架构里的 mHC、Engram、FP4 训练与 Hybrid Attention 都来自 Liang Wenfeng 团队 2025 年末-2026 年初的连续 paper 输出,架构创新可被其它开源团队部分复用——这是 V4 之后值得长期跟踪的"开源底层结构外溢"。
- GPT-5.5 与 Claude Opus 4.7 守住高端封闭模型阵地;Mythos 因 ASL-4 不公开发布,封闭模型最强档由 Anthropic Glasswing 内部联盟独享。
- Gemini 3.1 Pro 仍是综合最强多模态 + 最便宜输出($2 / M tokens 区间);Cloud Next 没有发模型更新,反而把战略叙事"全部下压到 agent 平台"上。
- 印度 Sarvam 30B / 105B(4/23):印度本土团队的开源 reasoning 模型,30B 仍 GQA、105B 上新型注意力——成为 V4 之外当周值得关注的次梯队开源选项(Sebastian Raschka X)。
- 影响判断:开源前沿与封闭前沿差距在 model 层重新被拉平到 3-6 个月内(DeepSeek V4 vs GPT-5.4),同时差距点由"原始能力"切换到"agent 集成 + 安全治理"。
Application
- 企业 agent 一站式收口:本周内 Google Gemini Enterprise / OpenAI Workspace Agents / Salesforce Headless 360 / Microsoft Agent Framework 1.0 同时把"任意 SaaS → MCP → agent → 跨平台调用"链路做到生产级。Arahi AI 4/30 周报概括:“4 月成为 agent 从企业试点切到中小企业基础设施的拐点”(Arahi AI 4 月 agent 周报)。
- Coding agent 二级市场:Claude Code、Cursor、Codex CLI、Windsurf 在 Salesforce / Google MCP 通道上获得"原生数据访问",从原本的"代码助手"扩张到"可改 SaaS 配置 / 跑业务流程"的位置。
- 法律 / 金融行业:Freshfields × Anthropic 合作进入第三个月,Claude 在合规与法律工作流上的用量较 6 周前 +500%;JPMorganChase 是 Glasswing 创始伙伴之一,金融行业 agent 准入路径开始与"安全审查"绑定。
- 教育 / 公共部门:OpenAI Workspace Agents 4/28 面向 ChatGPT Edu / Teachers 单独开 Build Hour,FedRAMP Moderate 同步准入——B2G 通道开始固化。
- 影响判断:4/30 应用层最大的变化是"AI 不再是侧边栏,而是 SaaS 的接口"——MCP/A2A 让任何 SaaS 都能被 agent 接管,传统 SaaS 厂商如果不在两周内对齐 MCP 路径,会被 OpenAI / Google / Salesforce / Microsoft 的统一 agent 入口收编。
层间联动影响
- Energy → Chips → Infra:电力接入 5+ 年排队、CoWoS+HBM4 全年售罄,使 2026 年内 frontier lab 算力扩张节奏被供应链硬封顶;Google 全栈策略(自研 TPU + 自有 Anthropic 算力供给)反而具备结构性优势。
- Chips → Model:DeepSeek V4 用 FP4 + Muon + mHC 把 1M context 推理 FLOPs 砍到 V3.2 的 27%,等价于"用算法补硬件",部分对冲国产推理算力上限;Pro 模型与昇腾绑定,使中国前沿模型部署对北美 GPU 依赖降低。
- Model → Application:开源前沿(V4)+ 封闭前沿(GPT-5.5 / Opus 4.7 / Gemini 3.1 Pro)能力同档,企业选择从"哪个模型最强"切换到"哪个 agent 平台最深、合规最近"。
- Model → Infra → Security:Mythos 反向证明前沿模型本身可造成漏洞外溢,Anthropic Glasswing 联盟构成"半官方 AI-x-Cyber 共防"机制;Mercor 数据泄露 + Anthropic 第三方凭据外溢说明 AI 厂商供应链是新攻击面。
- Application → Energy 反馈:企业 agent 平台一旦进入生产,单 SaaS 调用量级跃迁——Cloud Next 现场预测"agent 时代 token 消耗会比 chat 时代多 1-2 个数量级",将再度回压电力 / HBM / 互联带宽预算。
🎙️ 播客动态
- 晚点聊 — 163: 详解DeepSeek V4:Infra巨鲸、百万上下文走进现实、极致效率优化(2026-04-30)
程曼祺与 RadixArk SGLang 工程师赵晨阳、UCLA 博士生刘益枫深度复盘 DeepSeek V4:定位"沿 R1 测试时扩展范式做组合创新而非范式跃迁",编程能力对御三家仍有可感差距;FP4 + Muon + mHC + 新注意力四个新 feature 同时上线是延期主因;DeepSeek 不再披露训练成本、改"用模型能力说话";超长上下文稳定性正是 agent / 多步任务最缺的能力。 - What’s Next|科技早知道 — Google 的 AI 策略:不赌模型,赌什么?Google Cloud Next 现场 S10E09(2026-04-29)
丁教 Diane 与 Yaxian 现场 32,000 人 Cloud Next 复盘:“One Google” 战略——别人拼模型时 Google 几乎不谈模型、把整合底层算力到上层应用做成主轴;Multi-agent 落地、安全合规与"大厂全栈一层层往上吃"对创业公司挤压都是当周中文圈最热议题。
候选池变化与后续关注
新增候选人(new_candidate_people)3 名:
- Liang Wenfeng(梁文锋)——DeepSeek CEO / 创始人,V4 论文链 mHC + Engram 第一作者层级署名,4/24 V4 发布、4/30 中文圈深度访谈核心叙事。理由:当周开源前沿"事实领头人"。证据:Hugging Face DeepSeek-V4-Pro card、36kr 论文报道。建议入组:oss-ai-builders。
- Logan Kilpatrick (@OfficialLoganK)——Google AI Studio / Gemini API 产品负责人,Cloud Next 期间持续在 X 推送 Gemini Enterprise Agent Platform / Gemini Embedding 2 等开发者面信号。理由:覆盖 Google 侧产品 / 开发者平台 / API 信号的最直接公开账号。证据:Logan Kilpatrick X 主页、Google Blog 作者页。建议入组:ai-generalists(无 google-builders 组别时取最近概念组)。
- Wenting Zhao (@wzhao_nlp)——Qwen 研究科学家,3 月 Lin Junyang 离职事件中是少数公开发声评议组织变化的 Qwen 内部研究员,仍在持续推进 Qwen 开源模型方向,4 月延续技术发声。理由:Qwen 当前阶段最稳定的对外学术 / 工程信号源。证据:Wenting Zhao X 主页、TechCrunch Qwen 报道。建议入组:oss-ai-builders。
晋级建议(promoted_people):本日暂无 candidate→tracked 晋级,待 V4 后续 paper / API 互动数据再观察。
候选队列摘要(candidate_queue_summary):本日发现扫描有效候选 3 名,集中在开源前沿(DeepSeek/Qwen)与 Google 产品平台两条线。下周重点观察方向:(a) DeepSeek 是否补发 V4 paper;(b) Mira Murati / John Schulman(Thinking Machines Lab)4 月 Google Cloud 多十亿协议后的模型发布动作;© Anthropic Glasswing 50 家伙伴名单中是否出现行业代言人。
后续关注(不属人物候选):
- DeepSeek V4 在中文 / 英文社区的复用与微调案例(24-72 小时窗口最关键);
- OpenAI Workspace Agents 5/6 计费切换是否触发用量数据公开;
- Anthropic Mythos 第二轮是否扩大 Glasswing 名单或公开缩减 Mythos 访问;
- Google Gemini Enterprise Agent Platform 实际 Anthropic Claude 部署用量披露。
来源与交叉验证说明
源构成(source mix):本日 primary/official 集中于 Anthropic Glasswing 官页、Google Cloud 官 blog、DeepSeek API Docs、Hugging Face model card;company/filing 含 OpenAI 官公告与 Salesforce 官公告;media/analysis 包含 TechCrunch / VentureBeat / Fortune / Bloomberg / Stratechery / CNBC / Cybernews / Forrester / BizTech / Reuters;community/social 含 X.com(Simon Willison Mastodon、Sebastian Raschka X、Logan Kilpatrick X、Wenting Zhao X)与小宇宙播客(晚点聊 163 期、What’s Next S10E09)。
交叉验证(verification):DeepSeek V4 通过 DeepSeek API Docs + Hugging Face + Simon Willison + 晚点聊 + TechCrunch 至少五方对齐;Project Glasswing 由 Anthropic 官 + Schneier on Security + The Hacker News + Simon Willison 多源对齐;Cloud Next agentic 主旋律以 Google 官 blog + Stratechery + BizTech + Forrester + 中文播客四方交叉。Mythos 外泄事件 Cybernews + Fortune + Euronews + Yahoo + arnav.au 多媒体级互证,但仍待 Anthropic 公开技术细节。
数据缺口(coverage_gaps):xAI Grok / Meta Llama 4/30 无独立信号;DeepSeek V4 完整 paper 尚未发布;Workspace Agents 实际企业 token 消耗数据缺;Mythos 外泄"持续访问中"未给出技术终止时间表。
置信标签(confidence_flags):open-frontier-momentum、agent-platform-consolidation、mythos-supply-chain-leak、energy-and-packaging-double-bottleneck。