|
|
18 小時之前 | |
|---|---|---|
| arxiv-digest | 22 小時之前 | |
| deploy | 1 天之前 | |
| site | 18 小時之前 | |
| .gitignore | 3 天之前 | |
| README.md | 19 小時之前 | |
| generate_arxiv_digest.js | 3 天之前 | |
| package-lock.json | 3 天之前 | |
| package.json | 3 天之前 |
🤖 每日 AI/机器人领域论文精选推送
RobotDaily 是一个自动化论文精选系统,每天从 arXiv 抓取具身智能、表征学习、强化学习方向的最新论文,经过 LLM 筛选和解读后,推送到 Discord 频道并归档到 Hugo 博客。
skills/robdaily/
├── arxiv-digest/ # 核心模块:论文抓取与处理
│ ├── scripts/ # Python 脚本
│ │ ├── run_daily.py # 主入口:一键完成全流程
│ │ ├── fetch_arxiv.py # 从 arXiv RSS 抓取论文
│ │ ├── search_arxiv_papers.py # arXiv API 搜索
│ │ ├── select_papers.py # 论文筛选与评分
│ │ ├── get_daily_papers.py # 综合抓取工具
│ │ ├── complete_llm_pipeline.py # LLM 增强全流程
│ │ ├── render_digest.py # 渲染 HTML/Markdown 摘要
│ │ ├── enhanced_translation.py # 高质量中文翻译
│ │ ├── translate_abstract.py # 摘要翻译
│ │ ├── llm_translation_extraction.py # LLM 提取解读
│ │ ├── publish_discord.py # Discord 推送
│ │ ├── publish_hugo.py # Hugo 同步
│ │ ├── format_telegram_card.py # Telegram 卡片格式化(废弃)
│ │ └── install_system_cron.py # 系统定时任务安装
│ ├── output/ # 每日输出目录(自动生成)
│ │ └── YYYY-MM-DD/
│ │ ├── candidates.json # 候选论文列表
│ │ ├── selected.json # 精选论文列表
│ │ ├── enriched.json # LLM 增强后数据
│ │ ├── robotdaily.html # HTML 移动端摘要卡片
│ │ ├── robotdaily.md # Markdown 归档版本
│ │ └── manifest.json # 元数据清单
│ ├── logs/ # 运行日志
│ ├── references/ # 参考文档
│ │ └── selection-and-delivery.md # 筛选与推送策略
│ ├── assets/ # 静态资源(模板、样式)
│ ├── .env # 环境变量配置
│ └── .env.example # 配置模板
│
├── site/ # Hugo 博客站点
│ ├── content/ # Markdown 内容
│ │ ├── _index.md # 首页
│ │ ├── ai-daily/ # 每日 AI 简报(自动生成)
│ │ │ ├── _index.md
│ │ │ └── YYYY-MM-DD.md
│ │ ├── blog/ # 个人博客文章
│ │ ├── projects/ # 项目文档
│ │ │ └── robotdaily/
│ │ │ ├── architecture.md # 架构说明
│ │ │ ├── roadmap.md # 路线图
│ │ │ ├── ops.md # 运维文档
│ │ │ └── changelog.md # 更新日志
│ │ └── resume/ # 简历页面
│ ├── layouts/ # Hugo 模板
│ │ ├── _default/
│ │ │ ├── baseof.html
│ │ │ ├── list.html
│ │ │ └── single.html
│ │ └── index.html # 首页模板
│ ├── static/ # 静态资源
│ │ └── css/
│ │ └── site.css
│ ├── hugo.yaml # Hugo 配置
│ └── README.md # 站点说明
│
├── deploy/ # Docker 部署方案
│ ├── docker-compose.yml # 容器编排
│ ├── .env.example # 环境变量模板
│ └── README.md # 部署说明
│
├── node_modules/ # Node.js 依赖
├── package.json # Node.js 配置
├── generate_arxiv_digest.js # Node.js 入口脚本(旧版)
└── README.md # 本文件
cd skills/robdaily/arxiv-digest
cp .env.example .env
# 编辑 .env 配置 Ollama 模型、Discord 令牌等
# 仅生成简报(dry run)
python3 scripts/run_daily.py
# 生成并推送到 Discord
python3 scripts/run_daily.py --publish-discord
# 生成并同步到 Hugo
python3 scripts/run_daily.py --publish-hugo
# 生成并推送两者
python3 scripts/run_daily.py --publish-discord --publish-hugo
# 跳过 LLM 增强(快速测试)
python3 scripts/run_daily.py --skip-enrich
cd skills/robdaily/site
hugo server -D
# 访问 http://localhost:1313
cd skills/robdaily/deploy
cp .env.example .env
docker compose up -d
# 访问 http://localhost:9080
lmcpp/Qwen3.5-35B-A3B-UD-Q5_K_XL.gguf 模型高质量翻译| 变量 | 说明 | 默认值 |
|---|---|---|
INSIGHT_MODELS |
LLM 模型名称 | lmcpp/Qwen3.5-35B-A3B-UD-Q5_K_XL.gguf |
ROBOTDAILY_OUTPUT_DIR |
输出目录 | ./output |
HUGO_CONTENT_DIR |
Hugo 内容目录 | ../site/content/ai-daily |
cat arxiv-digest/logs/robotdaily.logls arxiv-digest/output/YYYY-MM-DD/cd site && hugo --quietOpenClaw Cron(推荐):
{
"name": "RobotDaily 每日推送",
"schedule": {"expr": "30 10 * * *", "kind": "cron", "tz": "Asia/Shanghai"},
"payload": {
"kind": "agentTurn",
"message": "运行 RobotDaily 每日简报"
}
}
系统 Cron:
30 10 * * * cd /path/to/robdaily/arxiv-digest && python3 scripts/run_daily.py --publish-discord >> logs/robotdaily.log 2>&1
编辑 scripts/fetch_arxiv.py 或 scripts/search_arxiv_papers.py,添加新的查询条件。
编辑 scripts/select_papers.py,修改 score_paper() 函数的权重参数。
scripts/publish_discord.pysite/layouts/_default/site/static/css/site.cssmaster,删除 mainLast updated: 2026-03-12