[Podcast·2026-W18] AI · XAbKflCncDo

← 返回主报告:[Podcast·2026-W18] Report

No Priors — Baseten CEO Tuhin Srivastava on Custom Models, and Building the Inference Cloud

  • Group: ai
  • Channel: @NoPriorsPodcast
  • Published: 2026-05-01
  • Duration: 43m
  • Language: en (auto)
  • Evidence: youtube_subtitles

TL;DR

Baseten 创始人兼 CEO Tuhin Srivastava 复盘公司过去 12 个月 30× 增速、年收入有望破 10 亿美元的 inference 云生意。他主张推理是 AI 的"最后市场"——应用层不会被基础模型吃掉,因为有专属用户信号的公司能把价值编译进 workflow,并通过 post-training 训练垂类专用模型(举例 Abridge 与客服流)。容量是 #1 焦虑:H100 用了 4.5 年价格还在涨,预计实际寿命接近 9 年;现在能签到 2028 年 1 月的合约容量,但市场迭代太快,长协反而压定价。开源讨论上,他直言中国实验室一年内冒出至少 5 家做开源模型而美国连一家像样的都难,正确做法是"把 DeepSeek 当 Meta 出品来用",否则就是只见树不见林。多 chip 与多模型未来是必然方向,但当前真正的护城河在系统/runtime 层而非模型本身:KV cache 实现比外界想象的还原始,scale、安全、性能层面仍有大量基础工作。可操作观察:所有 SaaS 想突围必须找到自家产品的"智能插入点"产生终端用户增量价值,套聊天框不再有效。