AI 日报|2026-04-17
一句话结论:Anthropic 发布 Claude Opus 4.7 强化工程与视觉能力,OpenAI 推出生命科学专用模型 GPT-Rosalind 开辟垂直赛道,TSMC Q1 利润飙升 58% 确认芯片景气未减速——前沿竞争从通用能力转向垂直深度与产能卡位。
摘要
- Anthropic 4 月 16 日正式发布 Claude Opus 4.7,SWE-bench Pro 64.3%(较 4.6 提升近 10 个百分点),视觉分辨率提升 3.3 倍,价格不变($5/$25 per M tokens)。同时引入自动化网络安全护栏,高风险请求自动拦截。
- OpenAI 同日推出 GPT-Rosalind,首款生命科学专用大模型,覆盖 50 种常见生物工作流,可调用公共生物数据库。另发布 GPT-5.4-Cyber 降低合法网安工作的拒绝边界。
- TSMC Q1 营收 NT$1.134 万亿(约 $350 亿),利润同比 +58%,CoWoS 先进封装增长 80%,绝大部分产能被 NVIDIA 锁定。
- 开源生态 加速:Google ADK(adk-python)8,200+ stars,Llama Stack 6,400+ stars,OpenAI Codex CLI 5,800+ stars。量化权重与推理代码首日即可用已成常态。
Frontier Labs / Frontier Model Radar
Anthropic — Claude Opus 4.7 正式发布
Anthropic 于 4 月 16 日发布 Claude Opus 4.7:
- SWE-bench Pro 64.3%,SWE-bench Verified 87.6%,GPQA 94.2%——均为当前商用模型最高水平。
- 视觉:3.3 倍高分辨率图像理解。
- 价格:$5/$25 per M tokens,与 Opus 4.6 持平。
- 安全:内置网络安全护栏,自动检测并阻止高风险请求;开放 Cyber Verification Program 供安全从业者申请。
- 社区反馈:部分用户在 X/GitHub/Reddit 反映 Claude 性能波动,Anthropic 回应称调整了 Claude Code 默认推理层级,否认与算力约束或 Mythos 相关。(Axios)
研判:Opus 4.7 是 Mythos 正式发布前的过渡产品,工程能力已领先竞品,但 Mythos 因网安风险暂不对外开放,Anthropic 在能力与安全之间的取舍信号值得持续关注。
OpenAI — GPT-Rosalind 生命科学模型 + GPT-5.4-Cyber
- GPT-Rosalind(4 月 16 日):首款垂直领域大模型,覆盖生化、药物发现、转化医学。训练覆盖 50 种常见生物工作流,可调用公共生物数据库,通过 ChatGPT、Codex 及 API 向合规客户开放。团队由 Life Sciences Research Lead Joy Jiao 和 Product Lead Yunyun Wang 主导。(OpenAI, Axios)
- GPT-5.4-Cyber:降低合法网安工作的模型拒绝边界,新增二进制逆向工程能力,配合 Trusted Access for Cyber(TAC)分层验证体系。(OpenAI)
研判:OpenAI 从通用旗舰模型开始分化出垂直专用模型线(Rosalind = 生命科学、Cyber = 安全),这一策略若成功可能改变定价和竞争格局。
Google DeepMind — Gemini 3.1 生态扩展
- Gemini 3.1 Pro 在 ARC-AGI-2 上 77.1%,保持多模态领先。
- Google ADK(Agent Development Kit)本周更新至最新版,adk-python 成为 GitHub 最热门 agent 框架之一(8,200+ stars)。
- Gemma 3n:4 GB VRAM 即可运行,支持文本/图像/音频。
其他前沿实验室
| 实验室 | 最新动态 |
|---|---|
| xAI | Grok 5 推迟至 Q2 2026;Grok 4.20 Beta 2 四智能体并行架构运行中 |
| DeepSeek | V3.2 性价比极高(~$0.28/M tokens);R2 后继因性能与芯片约束推迟 |
| Mistral | 开源模型持续迭代,在多项基准上逼近商用水平 |
| Qwen | 与 Mistral/Meta 共同推动开源前沿 |
未验证前沿信号:Anthropic Mythos 5(10 万亿参数)泄露报告仍无官方确认,因网安风险不会公开发布。
关键人物与社区信号
- Andrej Karpathy(@karpathy):近期讨论"LLM 知识库"概念——将文章、论文、数据集、图片汇入单一文件夹供 AI 索引。该思路对个人知识管理与检索增强有实用参考价值。
- Simon Willison(@simonw):持续分享 LLM 工具实验与 prompt 实战反馈,仍为开发者社区最活跃的实践信号源之一。
- Boris Cherny(@bcherny)/ Amanda Askell(@AmandaAskell):Anthropic 内部工具链与模型行为信号——Opus 4.7 发布周期的社区互动值得关注。
- 社区情绪:Anthropic 用户对 Claude 性能波动的讨论在 X/Reddit 持续发酵,部分用户对比 Opus 4.6 与 4.7 的实际体验差异。
Energy
- 数据中心电力消耗:IEA 预测 2026 年全球数据中心用电将达 1,000 TWh(相当于日本全国用电量),美国数据中心已占全国用电 ~4.4%。
- Eos Energy x TURBINE-X:签署联合开发协议,为 AI 数据中心部署私有电力基础设施。(Motley Fool)
- IREN:通过俄克拉荷马收购获取超 4.5 GW 可再生能源产能,定位数据中心绿色供电。
- 中美能源设备依赖:Bloomberg 报道美国 AI 数据中心扩张依赖中国电气设备进口。(Bloomberg)
研判:电力已从"未来约束"变为"当前瓶颈",能源基础设施建设速度将直接决定 AI 算力扩张节奏。
Chips
- TSMC Q1 2026:营收 NT$1.134 万亿,利润同比 +58%,超市场预期。CoWoS 先进封装产能增长 80%,NVIDIA Blackwell GPU 为首批采用 CoWoS-L 技术的产品。(CNBC)
- NVIDIA 产能锁定:NVIDIA 已预订 TSMC 绝大部分先进封装产能,TSMC 被迫将部分工序外包给第三方。(CNBC)
- ASML 确认:AI 支出未减速,光刻设备需求持续强劲。(247 Wall St)
- AMD:深度研报定位为"AI 基础设施巨头",数据中心 GPU 份额持续扩大。
- NVIDIA 财务:Q4 FY2026 营收 $681 亿,同比 +73.2%,数据中心营收 $623 亿;Q1 FY2027 指引约 $780 亿。
研判:芯片景气确认延续,但产能物理约束(封装、电力、散热)已成为增长天花板。NVIDIA 的产能锁定策略进一步压缩 AMD 等竞争者的高端供给空间。
Infra
- 头部科技公司 2026 AI 基础设施支出:Amazon、Alphabet、Meta、Microsoft、Oracle 合计预计 $6,600-6,900 亿。
- OpenAI 数据中心:八座建筑建设中,完工后总功耗 1.2 GW。
- Meta:El Paso 数据中心投资上调至 $100 亿,目标 1 GW 容量(2028 年投产)。
- NTT:3 月 19 日宣布全球产能翻倍至 4 GW。
- 散热挑战:单机架功率从 10-14 kW 飙升至 100 kW+,冷却系统需根本性重新设计。
- 监管:Virginia、Georgia、Indiana、Washington 已立法或拟立法要求数据中心运营商按用电量比例资助基础设施升级。(ITIF)
Model
- Claude Opus 4.7:工程能力领先(SWE-bench Pro 64.3%),视觉大幅提升。
- GPT-Rosalind:首个垂直生命科学大模型,标志 OpenAI 模型线分化。
- GPT-5.4:100 万 token 上下文,OSWorld-V 75%,原生 computer-use。
- Gemini 3.1 Pro:ARC-AGI-2 77.1%,多模态持续领先。
- 开源:Llama 4 Scout(MoE 109B/17B active),Gemma 3n(4 GB VRAM),DeepSeek V3.2($0.28/M tokens)。
研判:前沿模型竞争进入"垂直分化 + 工程深度"阶段,通用基准差距收窄后,垂直能力和开发者体验成为关键差异化点。
Application
- Google ADK(adk-python):最完整的多智能体框架,4 月 17 日更新,GitHub 8,200+ stars。支持 Python/TypeScript/Go/Java。
- Block Goose:本地优先 + 原生 MCP 支持的 agent 工具,4,900+ stars。
- OpenAI Codex CLI:5,800+ stars,终端内 AI 编程助手。
- HuggingFace smolagents:轻量级 tool-use 框架,4,100+ stars。
- Microsoft markitdown:将 PDF/DOCX/PPTX/HTML 转为干净 Markdown 供 LLM 消费,3,600+ stars。
- NVIDIA Ising:全球首个开源量子 AI 模型家族,加速量子计算机实用化路径。(NVIDIA)
- 群核科技(酷家乐)IPO:4 月 17 日港股上市,"杭州六小龙"首家 IPO,从 GPU 云渲染转型空间智能。
研判:Agent 框架生态从"百花齐放"进入"头部收敛",Google ADK / LangChain / LlamaIndex 三足鼎立格局初现。开源项目首日即提供量化权重+推理代码已成行业标准。
层间联动影响
- 芯片->能源->基础设施:TSMC Q1 利润飙升确认 AI 芯片需求不减,但 CoWoS 封装产能和数据中心电力已成双重物理瓶颈。能源基建速度直接约束算力扩张。
- 模型->应用->芯片:前沿模型从通用竞争转向垂直分化(GPT-Rosalind),对下游应用生态和上游算力需求结构产生重塑效应——垂直模型可能需要领域专用推理芯片。
- 安全->模型->监管:Anthropic Opus 4.7 内置网安护栏 + OpenAI TAC 分层验证 = 行业自律信号,但 Virginia 等州数据中心立法表明外部监管也在加速。
- 开源->商业:Llama 4 Scout / DeepSeek V3.2 的极低推理成本正在压缩商用 API 的定价空间,倒逼 OpenAI/Anthropic 向垂直能力和开发者体验要溢价。
🎙️ 播客动态
- 硅谷101 — E233|硅谷右翼的权力网如何形成?聊聊彼得·蒂尔的思想启蒙拼图:从 Peter Thiel 在斯坦福创立《斯坦福评论》起,追溯其思想源头(吉拉尔、施密特、施特劳斯),解析其如何通过 Palantir、Facebook 投资、扶持 JD Vance 等构建硅谷右翼网络。与 AI 产业的地缘政治交叉值得关注。
- 晚点聊 — 160: 群核IPO后与黄晓煌聊这15年:群核科技(酷家乐)4 月 17 日港股上市,创始人黄晓煌回顾 15 年创业历程——从英伟达回国、GPU 云渲染、到空间智能转型。"杭州六小龙"首家 IPO 的实战视角。
候选池变化与后续关注
新候选人发现
本日发现扫描识别出以下候选人:
- Joy Jiao(OpenAI Life Sciences Research Lead)——主导 GPT-Rosalind 开发,OpenAI 首个垂直领域模型的技术负责人。该模型标志 OpenAI 模型线从通用向垂直的战略分化。
- Yunyun Wang(OpenAI Life Sciences Product Lead)——GPT-Rosalind 产品负责人,推动生命科学 AI 从研究到产品的落地。与 Joy Jiao 共同代表 OpenAI 在垂直 AI 领域的组织投入。
- 黄晓煌(Xiaohuan Huang)(群核科技联合创始人 & 董事长)——"杭州六小龙"首家 IPO 掌舵人,从英伟达回国到空间智能,代表中国 AI 创业从工具化走向资本化的标志性节点。
后续关注
- Anthropic Mythos 何时/是否公开发布
- OpenAI 垂直模型线是否扩展至更多领域
- Grok 5 Q2 发布时间窗口
- DeepSeek R2 进展
- TSMC CoWoS 产能扩张时间表
- Google ADK 与 LangChain/LlamaIndex 竞争格局
- 数据中心电力监管立法进展
来源与交叉验证说明
来源构成:本报告使用 primary/official(Anthropic、OpenAI、TSMC 官方公告)、company/filing(TSMC IR、NVIDIA 财报)、media/analysis(CNBC、Axios、Bloomberg、Motley Fool)、community/social(X/Twitter、GitHub trending、播客)四类来源。
交叉验证:
- TSMC Q1 数据经 CNBC 与 Yahoo Finance 交叉确认。
- Claude Opus 4.7 性能数据经 Anthropic 官方博客与 SiliconANGLE、AI Business 多方报道交叉验证。
- GPT-Rosalind 信息经 OpenAI 官方、Axios、MarkTechPost 交叉验证。
- 开源项目星数来自 GitHub 实时数据。
- Mythos 10 万亿参数泄露信息标记为未验证,仅作为 watchlist 信号。
覆盖缺口:
- X/Twitter 特定日期(4/17)个人帖文抓取受限,人物信号偏向近期趋势而非当日精确动态。
- DeepSeek R2 推迟细节来源有限,置信度中等。