论文雷达日报｜2026-05-04

一句话结论：今日候选被 Agent / Multi-Agent 主线压制（4 篇 watchlist agent 命中且全部进入 Top picks），Robotics 与 Diffusion 理论各贡献一条横向信号；HF Daily metadata 未携带 arXiv categories，分类命中段退化为关键词聚合。

摘要

共抓到 19 篇候选（全部经 HF Daily + Semantic Scholar 双源对齐），过去 14 天 seen-pool 命中 0 篇，本日为干净窗口。
Watchlist 关键词命中 6 篇（agent×4, reasoning×2, preference optimization×1, vla×1），全部进入 Top picks，因此「Watchlist 分类命中」段不再单独列出。
主线 1：Agent 系统层方法日，从「Skill 表征」到「多 Agent 信息抽取 / 黑盒优化」覆盖 4 篇。
主线 2：机器人 fleet-scale RL（LWD）+ 模拟电路检索（AnalogRetriever）形成「机器人 + EDA Agent」横向呼应。
S2 similar_papers 全部为空（19/19），延伸阅读段今日空缺，已写入 coverage_gaps。

📌 Top picks (交叉命中)

From Skill Text to Skill Structure: The Scheduling-Structural-Logical Representation for Agent Skills（HF trending #11 / Qiliang Liang 等 / S2 已收录, citation_velocity=1.0） → 结构化技能表征让 Agent 技能可检索可复用。
- reason：唯一同时命中 watchlist_keyword:reasoning,agent + citation_velocity:1.0 的候选，ranking_score=6.9，今日最高。
Web2BigTable: A Bi-Level Multi-Agent LLM System for Internet-Scale Information Search and Extraction（HF trending #6, 23 upvotes / Yuxuan Huang 等） → 双层多智能体框架做互联网级搜索抽取。
- reason：watchlist_keyword:reasoning,agent，HF 上票数（23）远高于本日均值，WideSearch SR 38.50/XBench-DeepSearch 73.0 给出明确 SOTA 数字。
Online Self-Calibration Against Hallucination in Vision-Language Models（HF trending #8 / Minghui Chen 等） → MCTS+DPO 在线校准 VLM 幻觉。
- reason：watchlist_keyword:preference optimization + nice_to_have:benchmark，把 MCTS 树搜索接入 DPO 数据构造，是 RLAIF 路径上少见的 in-loop 校准范式。
Learning to Act and Cooperate for Distributed Black-Box Consensus Optimization（HF trending #9 / Zi-Bo Qin 等） → LLM 引导的去中心化协同优化框架。
- reason：watchlist_keyword:agent + nice_to_have:benchmark，把 LLM 当作稀疏 high-level guidance 注入 swarm dynamics，与 Web2BigTable 在「LLM 调度多 agent」上构成不同风格的对照。
AnalogRetriever: Learning Cross-Modal Representations for Analog Circuit Retrieval（HF trending #12 / Yihan Wang 等） → 三模态检索框架提升模拟电路搜索通过率。
- reason：watchlist_keyword:agent，把 retrieval 用于 EDA 闭环，扩展了 Agent in tool-use loop 在硬件设计场景的边界。
Learning while Deploying: Fleet-Scale Reinforcement Learning for Generalist Robot Policies（HF trending #13, 8 upvotes / Yi Wang 等） → 集群部署边训练通用机器人策略 95% 成功。
- reason：watchlist_keyword:vla，唯一一篇命中 VLA / robotics 主线的候选，long-horizon 任务上的提升点出 fleet RL 的价值证据。
Trees to Flows and Back: Unifying Decision Trees and Diffusion Models（HF trending #5 / Sai Niranjan Ramachandran, Suvrit Sra） → 建立决策树与扩散模型的数学统一。
- reason：nice_to_have:benchmark，理论性 contribution（GTSM 共享优化原理），适合作为方法论侧的横向参考。
Stable-GFlowNet: Toward Diverse and Robust LLM Red-Teaming via Contrastive Trajectory Balance（HF trending #1 / Minchan Kwon 等） → 去 Z 估计的稳定 GFlowNet 红队训练。
- reason：HF trending #1，去掉 partition function $Z$ 估计是 GFlowNet 实务化的关键改造，对 LLM red-teaming 数据生成有直接价值。

🏷 Watchlist 分类命中

本日所有 watchlist 关键词命中（agent×4, reasoning×2, preference optimization×1, vla×1）已全部纳入 Top picks，本段无额外条目。HF Daily metadata 未携带 arXiv 学科分类（cs.CL / cs.LG 等），无法按学科细分；详见 coverage_gaps: arxiv_categories_unavailable。

🔗 延伸阅读 (Semantic Scholar 相似论文)

本段今日无高置信度增量信号（S2 相似论文未返回）。19 个候选的 similar_papers 字段全部为空，已写入 coverage_gaps: s2_similar_unavailable。

🧑‍🔬 新出现的作者 / 团队

本日发现扫描未发现达标候选人。HF Daily payload 未携带 affiliation 字段，无法核对 tracked_affiliations 命中；候选作者池中无任何作者在本日 19 篇中出现 ≥2 次，也无 tracked_authors 命中。已写入 coverage_gaps: affiliations_unavailable。

📉 覆盖缺口与不确定性

s2_similar_unavailable：19/19 候选 S2 未返回 similar_papers，延伸阅读段空缺。
arxiv_categories_unavailable：HF Daily metadata 未附 arXiv 学科分类，分类命中段退化为关键词聚合。
affiliations_unavailable：HF Daily JSON 不附机构信息，无法做 tracked_affiliations 与机构发现，新作者发现段被强降级。
single_source_dominant_hf：所有候选均经由 HF Daily 引入，arXiv 直拉与 S2 主动检索本期未补充独立来源。

来源与交叉验证说明

来源	类别	note	本期使用
arXiv	primary	预印本本体（标题 / abstract / arxiv_id 经 arxiv_url 锚定）	19/19
HuggingFace Daily	curated	候选发现 + trending rank + upvotes 权重	19/19（trending #1–#18 + #44 longtail）
Semantic Scholar	metadata	s2_tldr / citation_velocity / s2_paper_id；similar_papers 本期空	19/19 tldr，0/19 similar

排序公式综合 HF trending rank + watchlist 关键词 + S2 citation velocity，未对 Top picks 做二次重排。所有结论锚定 primary（arXiv）或 metadata（S2 tldr）；未对单篇 PDF 做额外抓取。HF trending 仅用于发现与权重，不作为论文方法层证据。

Hanzhi's BLOG

[论文·2026-05-04]