论文雷达日报|2026-05-04
一句话结论:今日候选被 Agent / Multi-Agent 主线压制(4 篇 watchlist agent 命中且全部进入 Top picks),Robotics 与 Diffusion 理论各贡献一条横向信号;HF Daily metadata 未携带 arXiv categories,分类命中段退化为关键词聚合。
摘要
- 共抓到 19 篇候选(全部经 HF Daily + Semantic Scholar 双源对齐),过去 14 天 seen-pool 命中 0 篇,本日为干净窗口。
- Watchlist 关键词命中 6 篇(agent×4, reasoning×2, preference optimization×1, vla×1),全部进入 Top picks,因此「Watchlist 分类命中」段不再单独列出。
- 主线 1:Agent 系统层方法日,从「Skill 表征」到「多 Agent 信息抽取 / 黑盒优化」覆盖 4 篇。
- 主线 2:机器人 fleet-scale RL(LWD)+ 模拟电路检索(AnalogRetriever)形成「机器人 + EDA Agent」横向呼应。
- S2
similar_papers全部为空(19/19),延伸阅读段今日空缺,已写入coverage_gaps。
📌 Top picks (交叉命中)
- From Skill Text to Skill Structure: The Scheduling-Structural-Logical Representation for Agent Skills(HF trending #11 / Qiliang Liang 等 / S2 已收录, citation_velocity=1.0) → 结构化技能表征让 Agent 技能可检索可复用。
- reason:唯一同时命中
watchlist_keyword:reasoning,agent+citation_velocity:1.0的候选,ranking_score=6.9,今日最高。
- reason:唯一同时命中
- Web2BigTable: A Bi-Level Multi-Agent LLM System for Internet-Scale Information Search and Extraction(HF trending #6, 23 upvotes / Yuxuan Huang 等) → 双层多智能体框架做互联网级搜索抽取。
- reason:
watchlist_keyword:reasoning,agent,HF 上票数(23)远高于本日均值,WideSearch SR 38.50/XBench-DeepSearch 73.0 给出明确 SOTA 数字。
- reason:
- Online Self-Calibration Against Hallucination in Vision-Language Models(HF trending #8 / Minghui Chen 等) → MCTS+DPO 在线校准 VLM 幻觉。
- reason:
watchlist_keyword:preference optimization+nice_to_have:benchmark,把 MCTS 树搜索接入 DPO 数据构造,是 RLAIF 路径上少见的 in-loop 校准范式。
- reason:
- Learning to Act and Cooperate for Distributed Black-Box Consensus Optimization(HF trending #9 / Zi-Bo Qin 等) → LLM 引导的去中心化协同优化框架。
- reason:
watchlist_keyword:agent+nice_to_have:benchmark,把 LLM 当作稀疏 high-level guidance 注入 swarm dynamics,与 Web2BigTable 在「LLM 调度多 agent」上构成不同风格的对照。
- reason:
- AnalogRetriever: Learning Cross-Modal Representations for Analog Circuit Retrieval(HF trending #12 / Yihan Wang 等) → 三模态检索框架提升模拟电路搜索通过率。
- reason:
watchlist_keyword:agent,把 retrieval 用于 EDA 闭环,扩展了 Agent in tool-use loop 在硬件设计场景的边界。
- reason:
- Learning while Deploying: Fleet-Scale Reinforcement Learning for Generalist Robot Policies(HF trending #13, 8 upvotes / Yi Wang 等) → 集群部署边训练通用机器人策略 95% 成功。
- reason:
watchlist_keyword:vla,唯一一篇命中 VLA / robotics 主线的候选,long-horizon 任务上的提升点出 fleet RL 的价值证据。
- reason:
- Trees to Flows and Back: Unifying Decision Trees and Diffusion Models(HF trending #5 / Sai Niranjan Ramachandran, Suvrit Sra) → 建立决策树与扩散模型的数学统一。
- reason:
nice_to_have:benchmark,理论性 contribution(GTSM 共享优化原理),适合作为方法论侧的横向参考。
- reason:
- Stable-GFlowNet: Toward Diverse and Robust LLM Red-Teaming via Contrastive Trajectory Balance(HF trending #1 / Minchan Kwon 等) → 去 Z 估计的稳定 GFlowNet 红队训练。
- reason:HF trending #1,去掉 partition function 估计是 GFlowNet 实务化的关键改造,对 LLM red-teaming 数据生成有直接价值。
🏷 Watchlist 分类命中
本日所有 watchlist 关键词命中(agent×4, reasoning×2, preference optimization×1, vla×1)已全部纳入 Top picks,本段无额外条目。HF Daily metadata 未携带 arXiv 学科分类(cs.CL / cs.LG 等),无法按学科细分;详见 coverage_gaps: arxiv_categories_unavailable。
🔗 延伸阅读 (Semantic Scholar 相似论文)
本段今日无高置信度增量信号(S2 相似论文未返回)。19 个候选的 similar_papers 字段全部为空,已写入 coverage_gaps: s2_similar_unavailable。
🧑🔬 新出现的作者 / 团队
本日发现扫描未发现达标候选人。HF Daily payload 未携带 affiliation 字段,无法核对 tracked_affiliations 命中;候选作者池中无任何作者在本日 19 篇中出现 ≥2 次,也无 tracked_authors 命中。已写入 coverage_gaps: affiliations_unavailable。
📉 覆盖缺口与不确定性
s2_similar_unavailable:19/19 候选 S2 未返回similar_papers,延伸阅读段空缺。arxiv_categories_unavailable:HF Daily metadata 未附 arXiv 学科分类,分类命中段退化为关键词聚合。affiliations_unavailable:HF Daily JSON 不附机构信息,无法做 tracked_affiliations 与机构发现,新作者发现段被强降级。single_source_dominant_hf:所有候选均经由 HF Daily 引入,arXiv 直拉与 S2 主动检索本期未补充独立来源。
来源与交叉验证说明
| 来源 | 类别 | note | 本期使用 |
|---|---|---|---|
| arXiv | primary | 预印本本体(标题 / abstract / arxiv_id 经 arxiv_url 锚定) | 19/19 |
| HuggingFace Daily | curated | 候选发现 + trending rank + upvotes 权重 | 19/19(trending #1–#18 + #44 longtail) |
| Semantic Scholar | metadata | s2_tldr / citation_velocity / s2_paper_id;similar_papers 本期空 | 19/19 tldr,0/19 similar |
排序公式综合 HF trending rank + watchlist 关键词 + S2 citation velocity,未对 Top picks 做二次重排。所有结论锚定 primary(arXiv)或 metadata(S2 tldr);未对单篇 PDF 做额外抓取。HF trending 仅用于发现与权重,不作为论文方法层证据。