Paper Layer — 2026-05-03
直接消化 paper-digest 5/3 的 Top picks。今日 ranking_score 上限 3.5、无 frontier-lab / must-read venue 命中、S2 similar_papers 未返回 — 是典型长尾天,但 agent-native 科研基建三连击(ARA / Last Harness / Synthetic Computers) 把"用 agent 改造科研工作流本身"作为命题,对市场最有 framing 价值。
来自 paper-digest 的论文
- 2604.24658 The Last Human-Written Paper: Agent-Native Research Artifacts — 用机器可执行 ARA 取代论文叙事;PaperBench QA 准确率 72.4%→93.7%、RE-Bench 复现率 57.4%→64.4%,37 位作者含 Pentland / Mosharaf Chowdhury / Beidi Chen。市场含义:把"叙事税 / 工程税"作为科研出版业务模型的概念锚,对 AI-research 工具创业有直接价格-定位影响。
- 2604.21003 The Last Harness You’ll Ever Build — Worker / Evaluator / Evolution 三 agent 进化 harness,外层再 meta-evolve evolution 协议;与 ARA 形成"工具化科研 / 工具化 agent"对照。市场含义:harness 自动化 = LLM-Ops 价值链向 meta-eval 上移,承接 OpenAI / Anthropic agent SDK 的需求侧增量。
- 2604.28181 Synthetic Computers at Scale for Long-Horizon Productivity Simulation — 1000 台合成电脑、单 run >8 小时 / >2000 turn,作者 Tao Ge / Baolin Peng / Jianfeng Gao 来自微软老牌 NLP 流派。市场含义:把 “合成电脑作为 agent self-improvement 基底” 作为微软系正式信号,可视作 Microsoft Foundry agent stack 的 RL 基础设施叙事。
- 2604.27085 Efficient Training on Multiple Consumer GPUs with RoundPipe — 8×RTX 4090 上 1.48–2.16× 加速,单机即 LoRA Qwen3-235B(31K seq)。市场含义:消费级硬件训练大模型的成本曲线再下移,对独立微调供应链 + Chinese consumer-GPU narrative 都有边际利好。
- 2604.25441 Praxy Voice + 2604.25476 PSP — 同作者(Venkata Pushpak Teja Menta)配套:BUPS+LoRA 让非印度语 base 拿到商用级 Telugu/Tamil;附 PSP 可解释维度基准。市场含义:印度本土 TTS 商用阈值在 zero-commercial-data cost 路径下被打破,对 SaaS 区域化 TTS / IVR 厂商有上游冲击。
- 2604.27766 Instruction-Guided Poetry Generation in Arabic and Its Dialects — MBZUAI 系作者群(Preslav Nakov / Fajri Koto),HF trending #7。市场含义:弱(窄市场),仅作多语言能力延伸阅读。
- 2604.26067 RADIO-ViPE — 单目 RGB 在线开词汇语义 SLAM,HF upvotes 64(今日候选最高);TUM-RGBD 动态集 SOTA、不需要标定/深度/位姿初始化。市场含义:embodied / 机器人感知层降本,对家用机器人与自动驾驶感知供应商有边际意义。
- 2604.22868 Probing Visual Planning in Image Editing Models — EAR 把"编辑即推理"作为 reasoning 范式,AMAZE 程序化生成的 maze + queen,零样本所有 SOTA 失败。市场含义:编辑模型的 reasoning 评测正式被立题,对 image-edit 工具厂商(Adobe / Canva / Claude Design)有压力测试方向。
paper-digest 不会覆盖的技术信号
- NVIDIA Nemotron Coalition 启动 — Black Forest Labs / Cursor / LangChain / Mistral / Perplexity / Reflection AI / Sarvam / Thinking Machines Lab 8 家初创厂商联盟,目标推进 open frontier 模型,定位为对冲闭源 frontier(OpenAI / Anthropic / Meta Muse Spark)的开权重联盟。(NVIDIA Newsroom)
- Mistral Vibe 远程 agent + Medium 3.5 SWE-Bench Verified 77.6% — 不是论文但属于工程级技术信号,与 paper-digest 的 agent infra 三连击(ARA / Harness / Synthetic Computers)形成产业-学术对照。(MarkTechPost 5/2)
Coverage gaps
- paper-digest 5/3 candidate JSON 全部 affiliations 字段为空,frontier-lab / oss-ai-lab / robotics-lab 命中无法机器化判断。
- S2 similar_papers 未返回,延伸阅读今日空缺,跨论文引用关系不可建模。
- 唯一 venue 命中是 EACL 2026 user simulation survey(ranking_score 0.5),未进 Top picks。