--- name: arxiv-digest description: "Daily arXiv digest generation for embodied intelligence, representation learning, and reinforcement learning. Use when Codex needs to: (1) fetch recent papers from arXiv, (2) rank them with an applied-research bias, (3) pick 2-3 papers per domain, (4) translate abstracts into Chinese, add short explanations and tag keywords, (5) render mobile-friendly digest cards, or (6) publish the digest to Discord on a schedule." --- # arXiv Digest 每日从 arXiv 抓取具身智能、表征学习、强化学习方向的最新论文,经过 LLM 筛选和解读后,推送到 Discord 并归档到 Hugo 博客。 ## 核心入口 使用 `scripts/run_daily.py` 作为唯一入口: ```bash # 仅生成简报(dry run) python3 scripts/run_daily.py # 生成并推送到 Discord python3 scripts/run_daily.py --publish-discord # 生成并同步到 Hugo python3 scripts/run_daily.py --publish-hugo # 生成并推送两者 python3 scripts/run_daily.py --publish-discord --publish-hugo # 跳过 LLM 增强(快速测试) python3 scripts/run_daily.py --skip-enrich ``` ## 工作流程 1. **抓取论文**:从 arXiv RSS/API 获取最新论文 2. **智能评分**:基于创新性、应用价值、时效性自动排序 3. **领域筛选**:每个领域(具身智能、表征学习、强化学习)精选 2-3 篇 4. **LLM 增强**:使用 `lmcpp/Qwen3.5-35B-A3B-UD-Q5_K_XL.gguf` 模型生成: - 中文摘要翻译 - 简短价值解读 - 卡片标签 5. **渲染输出**: - `robotdaily.html` - 移动端友好的 HTML 卡片 - `robotdaily.md` - Markdown 归档版本 6. **多渠道推送**(可选): - Discord:推送到 RobotDaily 频道 - Hugo:同步到 `site/content/ai-daily/YYYY-MM-DD.md` ## 输出文件 每次运行在 `output/YYYY-MM-DD/` 目录生成: - `candidates.json` - 候选论文列表 - `selected.json` - 精选论文列表 - `enriched.json` - LLM 增强后数据 - `robotdaily.html` - HTML 移动端摘要卡片 - `robotdaily.md` - Markdown 归档版本 - `manifest.json` - 元数据清单 ## 配置 环境变量配置在 `arxiv-digest/.env`: ```bash # LLM 模型(默认使用 lmcpp/Qwen3.5-35B-A3B-UD-Q5_K_XL.gguf) INSIGHT_MODELS=lmcpp/Qwen3.5-35B-A3B-UD-Q5_K_XL.gguf # 输出目录 ROBOTDAILY_OUTPUT_DIR=/home/zhn/.openclaw/workspace/skills/robdaily/arxiv-digest/output # Hugo 内容目录 HUGO_CONTENT_DIR=/home/zhn/.openclaw/workspace/skills/robdaily/site/content/ai-daily # Discord 推送模式:thread | channel | fixed-channel | existing-channel DISCORD_DELIVERY_MODE=existing-channel # 线程自动归档时间(分钟) DISCORD_THREAD_AUTO_ARCHIVE_MIN=10080 ``` ## 定时任务 每天上午 10:30(Asia/Shanghai)自动运行: ```cron 30 10 * * * cd /home/zhn/.openclaw/workspace/skills/robdaily/arxiv-digest && python3 scripts/run_daily.py --publish-discord --publish-hugo >> logs/robotdaily.log 2>&1 ``` ## 相关文档 - [项目结构说明](../../README.md) - 整个 RobotDaily 项目结构 - [筛选与推送策略](references/selection-and-delivery.md) - 论文评分和推送规则 - [Hugo 部署说明](../../deploy/README.md) - Docker 部署方案 ## 维护 ### 查看日志 ```bash cat arxiv-digest/logs/robotdaily.log ``` ### 检查输出 ```bash ls -la arxiv-digest/output/$(date +%Y-%m-%d)/ ``` ### 验证 Hugo 站点 ```bash cd site && hugo --quiet ```