AI 日报|2026-04-24
一句话结论:OpenAI 发布 GPT-5.5 仅距 GPT-5.4 六周,Anthropic Mythos 网络安全争议升级至前国家网络总监公开警告,前沿模型竞速与安全治理张力同步拉满。
摘要
OpenAI 于 4 月 23 日发布 GPT-5.5,距 GPT-5.4 仅六周,刷新前沿模型迭代节奏纪录;该模型在编码、计算机操作与深度研究方面提升显著,已向所有付费用户开放。Anthropic Mythos Preview 的网络安全能力引发广泛讨论——前美国国家网络总监 Kemba Walden 撰文警告 Mythos 83% 首次漏洞利用成功率"我们尚未准备好"(Fortune, 4/23)。与此同时,Anthropic 估值在 Forge Global 上触及 $1 万亿,DeepSeek V4 仍未公开发布但据路透社已"数周之内"。开源层面,Kimi K2.6 支持 300 子 Agent 协同的 Swarm 架构,Slock.ai 等 Agent 协作平台持续活跃。
Frontier Labs / Frontier Model Radar
OpenAI — GPT-5.5 正式发布(4/23)
- GPT-5.5 面向 Plus/Pro/Business/Enterprise 用户上线,编码、计算机操作和深度研究能力全面增强(Fortune、CNBC、TechCrunch)。
- 定价 $5/1M input、$30/1M output,较 GPT-5.4 翻倍;Codex 活跃用户达 400 万,ChatGPT 周活突破 9 亿。
- 同步推出 Workspace Agents(研究预览),面向 Business/Enterprise/Edu 计划,免费至 5/6 后转为按 credit 收费。
- GPT-5.4-Cyber 模型已开始面向联邦机构和 Five Eyes 盟友定向安全通报。
Anthropic — Mythos 网络安全争议升级
- 前美国国家网络总监 Kemba Walden 在 Fortune 发表专栏:Mythos 能自主发现零日漏洞、链式构建利用链并掩盖痕迹,83.1% 首次尝试成功率(Fortune, 4/23)。
- 世界经济论坛发文讨论 Mythos 对网络安全范式的重新定义(WEF)。
- Anthropic 同步承认 Claude Code/Agent SDK/Cowork 近期"变笨"问题源自 3-4 月三次独立调整失误(The Register, 4/23)。
- Anthropic Forge Global 估值触及 $1 万亿,较三个月前 $3,800 亿大幅跳升(Yahoo Finance)。
- Freshfields 律所与 Anthropic 签署多年 AI 法律工作流共建协议,Claude 用量六周内增长约 500%(Yahoo Finance)。
Google DeepMind
- Gemini 3.1 Pro 保持抽象推理领先(ARC-AGI-2 77.1%),本日无增量发布。
Meta
- Muse Spark(原 Avocado)已于 4/8 发布,为 Meta 超级智能实验室首个模型,本日无增量更新。
DeepSeek
- V4 仍未公开发布;路透社 4/3 报道距发布"数周之内",将运行在华为昇腾 950PR 芯片上。DeepSeek + Qwen 全球市占已达 15%(一年前 1%)。
Qwen / Mistral
- Qwen 3.5 397B MoE(Apache 2.0、256K 上下文、201 语言)与 Mistral Small 4(统一推理/视觉/编码)均已在 4 月初发布,本日无增量更新。
xAI
- Grok 4.20 聚焦事实准确率提升,本日无增量更新。
关键人物与社区信号
- Kemba Walden(前美国国家网络总监):4/23 在 Fortune 发表长文直指 Mythos"几乎能入侵任何系统",呼吁协调网络安全基础设施投资——这是前政府网络安全高官首次公开警告特定 AI 模型的攻击能力。
- RC(@istdrc,Slock.ai 创始人、前 Kimi CLI 作者):本周持续迭代 Slock 平台新功能(搜索、线程收件箱、消息固定链接等),42 章经播客深度访谈中分享"Agent 动力学"概念——用 40 个 Agents + 7 人团队运行公司的实践经验。
- 唐文斌(Tang Wenbin,原力灵机创始人 & CEO,旷视联合创始人):4/23 晚点聊播客深度访谈,复盘旷视创业并分享原力灵机不做人形机器人的差异化具身智能路线。
- Andrej Karpathy:近期持续输出"编码 Agent 已跨过质变门槛"的判断,强调从脆弱 Demo 到长期任务持续执行的质的飞跃。
- Simon Willison:持续输出 Agentic Engineering 模式,同时警告 Prompt Injection 仍未解决、"暗工厂"模式(无人写或审核代码)正在扩散。
Energy
- 美国公用事业 $1.4 万亿 AI 基建支出计划:美国投资者所有公用事业公司公布至 2030 年 $1.4 万亿资本支出计划,由 AI 数据中心电力需求驱动,Duke Energy $1,022 亿、Southern Company $812 亿领投(Tech Insider)。
- IEA 预测全球数据中心 2026 年用电超 1,000 TWh(相当于日本全年用电量),能源约束被认定为 AI 扩张的关键瓶颈(GlobeNewsWire, 4/23)。
- CNN 4/23 报道"AI 对电网的冲击有解决方案,但它们并未落地",指出结构性阻碍(CNN)。
Chips
- DRAM 价格 2026 年已上涨近 50%,HBM 供需紧张推动存储芯片成为瓶颈之一(KAD)。
- Siemens-TSMC 合作扩展:AI 驱动 Design Rule Check 工具实现布局违规"近实时纠正",标志 AI 优化半导体制造进入实用阶段。
- 光互连加速:POET 等公司推动以光替代电信号的数据互连方案,解决功耗与带宽瓶颈。
- DeepSeek V4 将运行在华为昇腾 950PR 上,若落地将验证国产 AI 芯片在前沿模型训练中的可行性。
Infra
- OpenAI Workspace Agents 进入研究预览:Business/Enterprise/Edu 用户可创建共享 Agent 处理复杂长流程任务,免费至 5/6(TechCrunch)。
- Kimi K2.6 支持 300 子 Agent、4,000 协调步骤的 Swarm 架构(4/20 GA),标志 Agent 编排从单体走向大规模集群(MarkTechPost)。
- Slock.ai 持续迭代 Agent-人协作平台功能,RC 分享用 40 Agents 运行创业公司的实战经验。
Model
- GPT-5.5(4/23 GA):编码/计算机操作/深度研究能力提升,定价 $5/$30,六周迭代节奏创纪录。
- GPT-5.4 Thinking 变体:集成 test-time compute,OSWorld-Verified 桌面任务基准达 75.0%(超人类水平),较 GPT-5.2 提升 27.7 个百分点。
- Anthropic 修复 Claude Code/Agent SDK/Cowork 三次独立降级事故。
- 开源模型密集期:Qwen 3.5 397B MoE、Kimi K2.6、Mistral Small 4、Llama 4 Scout/Maverick 均已在 4 月上旬释出。2-4 月成为 AI 历史上最密集的模型发布季。
Application
- OpenAI ChatGPT for Clinicians:面向美国认证医师/NP/PA/药剂师的免费临床 AI 版本发布,标志垂直行业专用入口加速落地。
- Freshfields-Anthropic 法律 AI 工作流共建:六周内 Claude 用量增长 ~500%,大型律所全球部署。
- Agent 平台进入成熟竞争:OpenClaw(21 万+ stars)、Langflow(14.6 万)、Dify(13.6 万)、Block Goose(4,900+)构成活跃开源 Agent 生态。
层间联动影响
- Model → Infra 挤压:GPT-5.5 六周迭代节奏 + Kimi K2.6 300-Agent Swarm 共同推高推理计算需求,进一步加剧 Infra 层的算力与编排压力。
- Energy ← Infra 反馈:$1.4 万亿公用事业投资计划直接源于数据中心电力缺口,IEA 1,000 TWh 预测意味着 Energy 层已成为整个 AI 扩张的物理天花板。
- Chips → Model 制约:DRAM 涨价 50% + HBM 供需紧张限制大模型训练规模上限;DeepSeek V4 选用华为昇腾测试非 NVIDIA 路径的可行性。
- Model → Application 垂直化:GPT-Rosalind(生命科学)+ ChatGPT for Clinicians(医疗)+ Freshfields(法律)标志前沿模型从通用竞速转向垂直行业深度部署。
- Frontier Safety ↔ Chips/Infra 互锁:Mythos ASL-4 级别能力触发安全争议,同时 GPT-5.4-Cyber 向政府定向通报——安全层面的治理需求开始反向影响模型分发的 Infra 架构。
🎙️ 播客动态
- 硅谷101 — E234|未来实拍电影还存在吗?与导演陆川聊聊AI给影视人的恐惧与自由:探讨 AI 对影视工业核心流程的渗透,《灵魂摆渡·浮生梦》成为中国首部全 AI 电影,导演陆川与配音演员黄莺讨论 AI 将特效前期从六个月压缩至 72 小时的影响。
- 晚点聊 — 161: 中国最早AI创业者的故事,与唐文斌聊天才策略、旷视、十年前的机器人和具身新创业:旷视联合创始人唐文斌复盘早期创业,分享原力灵机不做人形机器人的差异化具身智能路线。
- 42章经 — 用 Agent 动力学,和 40 个 Agents 一起为「人 + AI」做产品|对谈 Slock.ai 创始人 RC:RC 分享从 Kimi CLI 到 Slock.ai 的创业历程,用 40 Agents + 7 人运行公司,观察到 Agents 会相互监督甚至出现"办公室政治"。
- What’s Next|科技早知道 — 英文访谈|和 Danilo McGarry 聊企业 AI 转型:AI 转型顾问 Danilo McGarry 分享主导 1400+ AI 项目的反直觉转型框架。
候选池变化与后续关注
新候选人发现
| person_id | 姓名 | 组别 | 发现原因 |
|---|---|---|---|
| kemba-walden | Kemba Walden | ai-generalists | 前美国国家网络总监,4/23 Fortune 专栏首次公开警告特定 AI 模型(Mythos)的攻击能力,呼吁协调网络安全基础设施投资 |
| rc-slock | RC | oss-ai-builders | Kimi CLI 原作者、Slock.ai 创始人,42 章经播客深度分享"Agent 动力学"概念与 40 Agents 运营实践 |
| tang-wenbin | 唐文斌 (Tang Wenbin) | ai-generalists | 旷视联合创始人、原力灵机 CEO,4/23 晚点聊播客深度访谈,不做人形机器人的差异化具身智能路线 |
候选池摘要
本日发现扫描产出 3 名达标候选人:Kemba Walden 因 Fortune 专栏首次以前政府高官身份公开点名前沿模型安全风险;RC 因播客深度分享 Agent 协作平台实战经验;唐文斌因播客深度复盘 + 具身智能差异化路线。均有具体 artifact(专栏文章/播客/产品)支撑。
后续关注
- DeepSeek V4 正式发布时间与华为昇腾 950PR 实际训练效果验证
- Anthropic Mythos 安全争议是否触发政策立法响应
- OpenAI Workspace Agents 免费期结束后(5/6)定价与采用率
- GPT-5.5 vs Gemini 3.1 Pro 在实际 coding/reasoning 场景的社区基准反馈
来源与交叉验证说明
来源构成:以 primary/official(OpenAI 发布公告、Anthropic 官网、UK AISI 评估报告)为主,company/filing(Anthropic Forge Global 估值、IEA 数据)提供基础数据,media/analysis(Fortune、CNBC、TechCrunch、Axios、Bloomberg、CNN、WEF)分析层,community/social(GitHub、播客、X.com)社区信号层。
交叉验证:GPT-5.5 发布三方确认(OpenAI 官方 + Fortune + CNBC + TechCrunch);Anthropic Mythos 争议多方确认(Fortune 专栏 + WEF 文章 + UK AISI 评估 + Bloomberg + Axios);能源瓶颈数据 IEA + GlobeNewsWire + CNN 三方对齐;播客数据来自订阅 feed 自动抓取。xAI/DeepSeek/Qwen 本日未抓取到高置信增量信号,以已知上下文标注状态。