YouTube Podcast 周报 · 2026-W21 (May 18–24)
覆盖 11 个订阅频道 · 本周共 13 条新集 · 字幕覆盖 12/13
🤖 AI 访谈 (Dwarkesh / No Priors / Latent Space)
Dwarkesh Patel — Chip design from the bottom up – Reiner Pope
- 1h20m · 发布 May 22 · 字幕:英文自动
- TL;DR:MatX CEO Reiner Pope 从逻辑门自底向上拆解 AI 芯片。核心原语是乘加 (multiply-accumulate),因为矩阵乘的每一步都是它,且累加需比乘法更高精度。用 AND 门生成部分积、用全加器 (3→2 压缩) 做 Dadda 乘法器,面积约 p×q 个全加器。关键洞察:芯片面积随位宽呈二次方缩放,这正是低精度 (FP4/FP8) 高效的根因 (B300 FP4 应比 FP8 快约 4 倍)。第二条主线是"计算 vs 通信"贯穿全栈:在 CUDA 核里,从寄存器堆取数的 mux (n×p 门) 远比乘加单元 (p×q) 昂贵,约 7/8 面积浪费在搬数上;脉动阵列 (Tensor Core/TPU MXU) 把权重矩阵就地缓存、慢速涓流加载,使通信只随 x 而非 xy 增长,从而最大化算力占比。还讲了时钟周期由反馈回路临界路径决定、流水线寄存器插入、FPGA 用 LUT(本质是 mux 真值表) 换灵活性故比 ASIC 贵约 10 倍、CPU 缓存导致非确定延迟、TPU 用 scratchpad 把取数决策交给软件。可操作观察:设计芯片时先设定数据搬运占芯片面积的预算 (如 10%),再据此反推寄存器堆与脉动阵列的尺寸——这是耦合的核心 sizing 决策。
No Priors — The Story Behind Cerebras’ $63 Billion IPO with Founder and CEO Andrew Feldman
- 30m · 发布 May 21 · 字幕:英文自动
- TL;DR:Cerebras 创始人 Feldman 复盘公司从冷门到 630 亿美元 IPO 的路径。核心论点:要比 GPU 快 15–20 倍,架构必须彻底不同,所以从一开始就押注"晶圆级"——做一块约 4.6 万平方毫米、餐盘大小的芯片(对手只做邮票大小),这是计算史上 70 年无人攻克的难题(连 Gene Amdahl 都失败),2017–2019 年每月烧约 800 万、反复造不出来,直到 2019 年夏才良率达标。关键论据:芯片做出来后多年无人问津(第一代仅卖约一打、第二代约 300 台),因为 AI 在 2025 年前只是"新奇玩意";他断言"慢推理的市场是零,就像慢搜索、拨号上网"。转折来自先攻超算/国家实验室(Argonne、Lawrence Livermore、Sandia)和油气、制药等不在意软件成熟度的客户,再靠主权基金 G42 的 10 亿美元订单跨越鸿沟、完成规模化"实战测试",最终承接 OpenAI(逾 200 亿)和 AWS 大单。可操作观察:Sam Altman 在 2025 年中首次意识到快推理的重要性而促成合作;今年要把制造产能扩 10 倍;公司约 800–850 人、内部每工程师 token 花费 8 个月内从 1000 美元飙到 2.5–3 万美元,但 AI 编码只对少数"治理多 agent"的人变成 100x,多数人仍在摸索。上市本质是用更低资本成本换取审计带来的可信度与"唯一 AI 纯标的"定位。
Latent Space — Less is More: Tiny Recursive Networks - Paper Club 20260513
- 54m · 发布 May 20 · 字幕:英文自动
- TL;DR:Karthik 逐代码讲解 TRM(Tiny Recursive Models,arXiv 2510.04871),核心主张是"少即是多":在 Sudoku、迷宫、ARC 等抽象推理任务上,不必堆叠多层 Transformer,只需一个微型网络在循环中反复复用即可。它简化前作 HRM——HRM 受生物启发用 ZL/ZH 两个不同频率更新的隐状态,TRM 证明只保留单个"草稿纸"潜变量 Z 加输出 Y 就够了。架构是多层递归(外层 step、内层 cycle),靠 SwiGLU 做格子间双向信息混合。两个关键工程点:梯度只在最后一步回传(中间 cycle 截断梯度省显存);用深监督把损失放在所有递归步之后而非每步单独算,仅此一项在 Sudoku 上带来约 10% 提升;训练时加可学习的自适应停止(halting),推理时直接丢弃。可操作观察:作者尝试把该思路搬到自回归语言建模(TARM)几乎无效,因为威力来自双向结构而非因果建模;因此 TRM 真正适配的是边缘/端侧、无法微调大模型的小参数高效推理场景。
💰 VC 机构 / 访谈 (a16z / Sequoia / 20VC)
20VC — Why Anthropic Are Causing a Comp Crisis & Why You’d Never Hire From Salesforce or ServiceNow
- 1h23m · 发布 May 23 · 字幕:英文自动
- TL;DR:Snowflake 销售老将 Chris Degnan 与 Chad Peets 合体做销售招聘公司,核心论点:产品再好,烂销售也会把钱留在桌上,AI 时代构建外呼型(outbound)销售铁军仍是最大差异化,PLG 只能叠加其上。识人法则极硬:别招 Salesforce/ServiceNow 的人——垄断公司客户早已锁定,销售从不开新 logo、不会做 pipeline generation;要招 MongoDB、Wiz 这类培养体系强的销售领袖,更偏爱在三流品牌、劣质产品下还能赢单的"grit"型选手。针对 Anthropic/OpenAI 用 1000 万至 3000 万美元天价 package 抢人引发的薪酬危机,反制论据很新颖:这些大厂用"集体配额(group quota)“,顶尖与最差选手拿一样钱(他直斥为 socialism),说明它们并不真在乎销售质量,讲究 meritocracy 的销售人不该去。可操作观察:用 windfall 条款应对单 rep 签下 15-20M 巨单的超额佣金;只按已签年约(booked contract)而非 MRR 付佣,规避"递延流失"和无护城河风险;查差旅记录判断二线经理是否摆烂(出差越少越没干活);forward deployed engineer 本质是"美化版专业服务”,会留技术债,好工程师不该做。并预测 Anthropic 是四万亿美元公司。
20VC — Andrej Karpathy Joins Anthropic | SpaceX Files S1: How Does it Trade | Cerebras Smashes Day 1
- 1h27m · 发布 May 21 · 字幕:英文自动
- TL;DR:Lemkin 与 Scale 的 Rory O’Driscoll 复盘本周科技要闻。Anthropic 拟融 300 亿美元、估值超 9000 亿(较 2 月 3800 亿近三倍),约合 18 倍年化收入;二人认为按 ARR 倍数这是"整个创投界最划算的交易",且 Dario 故意折价、追求一周内无戏剧化成交,与 Sam 把估值顶到极限、靠或有条款拼凑 1100 亿的风格相反。Cerebras IPO 定价 185 美元、首日大涨 68%,是 Snowflake 以来最大美股科技 IPO,但属"N of one"——半导体热、推理热、客户是 OpenAI;二人判断只对 Figma 级别以上公司打开窗口。SpaceX 拟 6/12 上市,估值 1.75 万亿、募 75 亿;但其 S1 只反映去年 12 月(独立 SpaceX+Starlink 营收约 150-180 亿、增 20-30%),不含 xAI、Anthropic、Cursor 交易,“史上最搞笑 S1”。Salesforce 今年花 3 亿美元买 Anthropic token(几乎全用于编码),折合每工程师约 1.5-2 万美元/年,被指其实不贵。可操作观察:买 IPO 首日收盘价的历史基准回报为负,别盲目追涨;并关注 Meta/Cisco/LinkedIn 万人级裁员引发的政治反弹,Lemkin 预言科技业将被迫"再通胀"重新雇人以避免社会动荡。
Sequoia Capital — Notion’s Ivan Zhao: The Refounder
- 1h3m · 发布 May 21 · 字幕:英文自动
- TL;DR:Notion 创始人 Ivan Zhao 提出区别于 founder mode 的第三种组织哲学——“做爵士乐队,而非行进乐队”(戏称 Jasmo):放弃自上而下的整齐指挥,转向即兴、自组织、靠少数顶尖人才"扔进去看模型给你什么"的协作。反主流核心是开发应技术驱动优先而非客户需求优先,像酿啤酒般无法预设结果,只能让最好的人探索 AI 边界。论据是他两次重启公司:2015 年搬去京都拿到 PMF,2023 年坎昆围绕生成式 AI 再次重创立,并据此今年拆掉 CMO 组织,把叙事并入产品、需求生成并入销售。他预判 AI 会随上下文积累逐步接管更多决策,人类只提供品味与语境。可操作观察:SaaS 要 AI 化,应主动招爵士型人才、按贡献而非职级重构组织,而非把 AI 塞进旧的行进乐队式流程。
a16z — Is Defense the Next Trillion-Dollar Category? | a16z American Dynamism Summit
- 12m · 发布 May 19 · 字幕:英文自动
- TL;DR:Saronic CEO Dino 与战争部长 Duffy 论证重建美国防务工业基础的路径:传统基础脆弱,依赖单一供应商、专为防务定制、利润微薄,自造了供应链漏洞。核心主张是无法在钢材和人工成本上比拼中国,因此必须从第一性原理重新设计舰船——少用钢材、转向软件自主与数字化,把舰船造得「不像百科全书,更像宜家」,让无需 15 年焊接经验的工人也能快速上手。关键论据:Saronic 首艘 Marauder 约 5 万工时,而一艘驱逐舰需 700–900 万工时,自主化带来速度与规模的数量级跃迁。Duffy 指出产能是对外军售的最大瓶颈,政府正激励传统承包商自掏私人资本扩产,取代以往的政府补贴模式。可操作观察:押注「商业优先」——以 Port Alpha(目标世界最大造船厂之一,造货柜船、油轮等商船)在和平时期维持战时产能,避免企业仅靠下一份政府合同续命,这是判断防务制造初创可持续性的关键标尺。
Sequoia Capital — Rebuilding IT From the Ground Up for the AI Age: Serval’s Jake Stauch
- 38m · 发布 May 19 · 字幕:英文自动
- TL;DR:Serval 创始人 Jake Stauch 主张做"AI 时代的 ServiceNow",定位企业服务管理(ESM)/员工内部支持平台。核心论点:ServiceNow 把企业软件抽象为"数据库之上的工作流"这一原语是对的,但人工搭建与维护工作流要数周到数月,业务变了自动化就落后,因此 Serval 保留同样原语,却用 AI 重写构建方式。关键论据是双 Agent 架构:admin agent 把管理员的自然语言描述(步骤、权限、审批、逻辑)通过 codegen 引擎即时生成为代码工作流,并自动从各数据源拉取、保鲜数据库,几乎零开发时间;help desk agent 面向终端员工,只能调用管理员已显式发布、带权限与审批的工具和技能,借此控制安全边界。终端交互用 OpenAI 模型,产品刻意做成"无聊的传统企业软件外壳 + 无限智能"。可操作观察:评估 AI 原生 ITSM 时,应优先看是否用 codegen 替代人工配置、并以"管理面 vs 执行面"分权来约束 Agent 权限,而非只看聊天机器人能力。
a16z — How Founders Can Build for Law Enforcement and First Responders | The a16z Show
- 11m · 发布 May 18 · 字幕:英文自动
- TL;DR:a16z 主持人对话 Flock Safety 董事 Rahul 与亚利桑那 DPS 上校 Glover,主论点是公共安全正被无人机、传感器与 AI 重塑,给"不想优化广告点击、想救人"的创业者打开巨大蓝海。关键论据:Flock 把车牌识别相机、枪声探测与无人机数据融合,听到枪声后无人机自动起飞追踪逃逸车辆、识别 Amber 警报车,这是直升机 24/7 待命也无法可持续实现的能力;无人机还能提供态势感知化解误报(“持枪者"实为持扫帚清洁工)。技术采纳遵循炒作周期——执法者"既恨改变也恨不变”,如同当年随身摄像头、电击枪从抵制到普及,最终因利于警员、社区与国家而必然落地。可操作观察:创始人要把产品塑造成"不可避免的未来",并大量沉浸于警务现场——做 ride-along、当预备警员,先学会行话再决定造什么,否则无法真正服务一线。
20VC — The One Man Accelerator at The Four Seasons & Why VCs Can Be Sharks | Josh Browder
- 1h35m · 发布 May 18 · 字幕:英文自动
- TL;DR:DoNotPay 创始人 Josh Browder 拆解其"一人加速器"天使模式:把 Thiel Fellowship 的 10 万美元拨款滚成 1000 万美元天使组合,早期押注 Micro One、Yuzu、owner.com 等极年轻创始人。核心论点是年轻创始人"别无退路只能成功"——比起会回去招十个谷歌前同事的资深工程师,他们 grit 高 10 倍、自身即首位用户、与问题有真实深连接(他靠恨政府的停车罚单做产品,Adam Guild 为母亲狗美容店建产品)。运营上他把被投创始人塞进四季公寓的"备用房"——按床 50 美元/晚,像加州旅馆般"不融到机构种子轮不许退房",三周速成课覆盖 pre/post-money、pitching 等盲区,主攻 pre-seed 三大死因:缺钱、失去希望、联创内讧。VC 批判分两层:一是 VC 过度迷信学历、扎堆抢数学奥赛选手,错把 IQ 当首要、忽视"永不放弃";二是二级市场买家是"鲨鱼"——主动来收 Anthropic 或创始人股份者往往比创始人更懂市场、估值多半还要涨,劝创始人勿过早贱卖。可操作观察:pitch VC 如打扑克,永不暴露目标价格,因价格是 deal 热度的函数,开口要太高反而降温;逼创始人做亲身 demo 可引爆顶级轮。宏观警示:每个赚 2000 万–1 亿的 Anthropic 员工背后有 7000 名 Block 员工被裁,财富过度集中不可持续,“有生之年或现革命”。
📈 公开市场 (Bg2Pod / All-In)
All-In — SpaceX’s $2T Case, Nvidia’s Shock Selloff, America Turns on AI, Trump Pulls AI Order, Bond Crisis?
- 1h42m · 发布 May 22 · 字幕:英文自动
- TL;DR:本期请来基金经理 Gavin Baker,主线是 AI 资本盛宴与日益高涨的反 AI 民意之间的张力。SpaceX 拟以约 2 万亿美元估值上市(代码 SPCX,预计 6 月 12 日),将是史上最大 IPO、超沙特阿美 290 亿规模一倍以上;去年营收约 190 亿、今年看 250–300 亿,Starlink 是当前现金牛。Nvidia 再度爆表:Q1 营收 816 亿(同比 +85%、环比 +20%),净利 580 亿、自由现金流 480 亿、毛利率 75%,但股价仍遭抛售,凸显高预期下的脆弱。Karpathy 加盟 Anthropic 主攻递归自我改进。嘉宾警告美国出现反科技、反数据中心情绪,疑有 CCP 资助的舆论战;一项 AI 总统行政令当天被临时撤回。宏观转冷:通胀回头、10 年期美债升至 4.6%(远高于 Bessent 想压到 4% 的目标),日本 30 年期 5.1% 创纪录,债市承压。可操作观察:Baker 主张只重仓极少数能持有十年的高确信公司(如 Nvidia),其余一概不投机——在牛熊两市皆然。
🌏 中文科技 (xiaojunpodcast / 硅谷101)
xiaojunpodcast — 141. Freda的投资札记第2集:Tokenmaxxing、把电机塞进蒸汽机、接力赛变篮球赛、孤独、人的连接
- 1h23m · 发布 May 18 · 字幕:无字幕
- TL;DR:基于 metadata,无字幕 Altimeter合伙人Freda Duan判断:token非好指标,行业将从按token转向按效果收费;coding agent催生"better AI makes better AI"循环,落后者如无引擎之马难追。她认为投资人正抛弃软件公司(discount rate逻辑),组织将从接力赛变篮球赛式小分队。可操作观察:今年她重新担忧应用层,因Anthropic/OpenAI正吃编程、金融、音频;看好Neo Labs与Agent基础设施。
🏛️ 公司深潜 (Acquired)
Acquired — Vanguard: The communist capitalist who saved investors a trillion dollars (Audio)
- 3h48m · 发布 May 18 · 字幕:英文自动
- TL;DR:主论点: Vanguard 之所以能管理 10 万亿美元指数资产、让投资者省下上万亿费用,核心不在选股而在制度设计——客户即股东的"互助所有制"。关键论据: 1950 年代主动基金管理费高达 1.5%–2%,管理公司"旱涝保收"。Bogle 1974 年从 Wellington 内斗出局后另起炉灶,设计出基金持有人共同拥有管理公司、按成本价(at-cost)运营、不向外部股东分利的结构;1975 年推出首只面向散户的 S&P 500 指数基金,仅向标普支付 2.5 万美元/年授权费。随后转为免佣(no-load)直销,短期牺牲分销、长期触发规模复利: 费率随 AUM 增长持续压缩到个位数基点,形成无人可复制的成本飞轮。被动相对主动的超额收益不只来自低费,还有"少操作"的行为优势。可操作观察: Vanguard 当前隐忧是大量 AUM 通过 Fidelity 等竞争对手券商代持,客户与 Vanguard 无直接关系;当持仓成本基已极低、再压费空间有限时,分销渠道控制权而非费率将成为下一个竞争焦点。
本周跨集主题观察
- Anthropic 估值与人才虹吸成为全行业定价锚(来源:20VC vRPBhik_AXU、20VC z94zlbVn048、All-In HGbA6ze0_3M):Anthropic 拟融 300 亿、估值超 9000 亿(约 18× 收入),Karpathy 加盟主攻递归自我改进,并以千万级 package 引爆销售/工程薪酬危机;Salesforce 一年豪掷 3 亿美元买其编码 token。延续近几周「Anthropic 崛起」主线,但本周首次同时从估值、人才、客户支出三面被坐实。
- 晶圆级 / 低精度硬件叙事集中走上台前(来源:Dwarkesh oIk3R-sMX5o、No Priors jeop9wfb9jU、20VC z94zlbVn048、All-In HGbA6ze0_3M):Dwarkesh 自底向上拆解「计算 vs 通信」与低精度为何高效;Cerebras 押注餐盘大小晶圆、630 亿 IPO 首日 +68%;Nvidia 财报爆表却遭抛售。三档节目从原理、IPO、二级市场三个层面同时聚焦 AI 芯片,呼应上周「挣脱单一 GPU 抽象」。
- SaaS / 企业软件的 Agent 化重构,同时改写组织形态(来源:Sequoia ill76IbVuM8、Sequoia j7ypvRUFY7M、xiaojunpodcast MjTfhm5N8x8):Notion 提出「爵士乐队」式组织并拆掉 CMO;Serval 用双 Agent(codegen 管理面 + 受限执行面)重写 ServiceNow;Freda 判断收费将从按 token 转向按效果、组织从接力赛变篮球赛。产品 Agent 化与组织扁平化在三集里被绑定讨论。
- AI 财富集中触发社会与政治反弹(来源:20VC z94zlbVn048、20VC 5CtT6p2HaCI、All-In HGbA6ze0_3M):20VC 两集分别预言科技业将被迫「再通胀」重新雇人、并警告「每个 Anthropic 富翁背后约 7000 名 Block 员工被裁」恐酿革命;All-In 则记录反 AI 民意、数据中心抵触与一项 AI 行政令当天被撤回。延续上周「AI 公众舆论之争」,本周升级为就业与政治风险。
- 国防 / 公共安全 / 硬资产成为新蓝海母题(来源:a16z pddFfZy4nZU、a16z Ie07zcmbnhM、All-In HGbA6ze0_3M、20VC z94zlbVn048):a16z 两集分别论证重建美国造船与防务工业基、以及无人机+传感器重塑执法;All-In 与 20VC 同步追踪 SpaceX 约 1.75–2 万亿美元的史上最大 IPO。延续上周「国家级硬资产竞赛」,并明确「商业优先维持战时产能」为可投资标尺。
Coverage Notes
- 本周未发布:Bg2Pod(public_markets)
- RSS 获取为空 / 失败:硅谷101(china_tech)—— channel_fetch 报
rss empty or failed,可能本周无新集,也可能为抓取异常,建议下周复查 channel_id 是否仍有效 - 字幕缺失(已降级 metadata_only):xiaojunpodcast「141. Freda的投资札记第2集」—— 无可用字幕(语言识别为 unknown),TL;DR 基于节目描述生成