ClawLab
/
RobotDaily


			
				
					
						
						
							123456789101112131415161718
							<!doctype html><html lang=zh-cn><head><meta charset=utf-8><meta name=viewport content="width=device-width,initial-scale=1"><title>搜索 · Indigo Floyd's Latent Garden</title><meta name=description content="Exploring latent space and cultivating sweet trips."><link rel=stylesheet href=../css/site.css><link rel=icon href=../favicon.ico type=image/x-icon><link rel=apple-touch-icon href=../logo.png><link rel=preconnect href=https://fonts.googleapis.com><link rel=preconnect href=https://fonts.gstatic.com crossorigin><link href="https://fonts.googleapis.com/css2?family=Cormorant+Garamond:wght@400;500;600&display=swap" rel=stylesheet></head><body><header class=site-header><div class="wrap header-inner"><div><a class=site-title href=../><img src=../logo.png alt=Logo class=site-logo>
Indigo Floyd's Latent Garden</a><p class=site-tagline>Exploring latent space and cultivating sweet trips.</p></div><button class=menu-toggle aria-label=菜单 aria-expanded=false>
<span></span>
<span></span>
<span></span></button><nav class=site-nav><a href=../>Home</a>
<a href=../ai-daily>AI Daily</a>
<a href=../blog>Blog</a>
<a href=../resume>Resume</a>
<a href=../search>Search</a>
<a href=../search class=search-link>🔍</a></nav></div></header><main class=wrap><section class="card page-head"><span class=eyebrow>Search</span><h1>搜索</h1><p>搜索全站文章和标签</p><div class=search-box><input type=text id=search-input placeholder=搜索文章标题、内容或标签...><div id=search-results class=search-results></div></div></section><script src=https://cdn.jsdelivr.net/npm/fuse.js@6.6.2></script>
<script>const posts=[{title:'"项目架构"',url:'"/projects/robotdaily/architecture/"',date:'"2026-03-12"',summary:'"项目架构 目录结构 skills/robdaily/ ├── arxiv-digest/ # 代码层 │ ├── scripts/ │ │ ├── run_daily.py # 主调度脚本 │ │ ├── fetch_arxiv.py # 论文抓取 │ │ ├── llm_process.py # LLM 处理 │ │ ├── publish_discord.py # Discord 推送 │ │ └── publish_hugo.py # Hugo 文章生成 │ └── .env # 配置 (API keys, bot token) ├── site/ # Hugo 站点层 │ ├── content/ │ │ ├── ai-daily/ # 每日论文归档 │ │ ├── projects/ # 项目管理层页面 │ │ ├── blog/ # 博客文章 │ │ └── resume/ # 简历页面 │ ├── layouts/ # Hugo 模板 │ ├── static/ # 静态资源 │ └── hugo.yaml # Hugo 配置 └── deploy/ # 部署层 ├── docker-compose.yml # Docker Compose └── hugo.Dockerfile # Hugo 容器镜像 生成链路 抓取: fetch_arxiv.py 从 arXiv API 获取今日论文 筛选: 聚焦具身智能/表征学习/强化学习，每领域 2-3 篇 富化: llm_process."',tags:"null",content:`"项目架构 目录结构 skills/robdaily/ ├── arxiv-digest/ # 代码层 │ ├── scripts/ │ │ ├── run_daily.py # 主调度脚本 │ │ ├── fetch_arxiv.py # 论文抓取 │ │ ├── llm_process.py # LLM 处理 │ │ ├── publish_discord.py # Discord 推送 │ │ └── publish_hugo.py # Hugo 文章生成 │ └── .env # 配置 (API keys, bot token) ├── site/ # Hugo 站点层 │ ├── content/ │ │ ├── ai-daily/ # 每日论文归档 │ │ ├── projects/ # 项目管理层页面 │ │ ├── blog/ # 博客文章 │ │ └── resume/ # 简历页面 │ ├── layouts/ # Hugo 模板 │ ├── static/ # 静态资源 │ └── hugo.yaml # Hugo 配置 └── deploy/ # 部署层 ├── docker-compose.yml # Docker Compose └── hugo.Dockerfile # Hugo 容器镜像 生成链路 抓取: fetch_arxiv.py 从 arXiv API 获取今日论文 筛选: 聚焦具身智能/表征学习/强化学习，每领域 2-3 篇 富化: llm_process.py 生成中文摘要和简析 发布: Discord: publish_discord.py 推送 Embed 卡片 Hugo: publish_hugo.py 生成 Markdown 归档 持久化边界 Git 仓库: 代码、配置、每日 Markdown 归档 容器文件系统: 临时构建产物（重建时丢弃） 外部服务: Discord 消息历史、arXiv 元数据 项目管理层 位于 site/content/projects/，包含：\\n项目导航页 架构设计文档 运维指南 路线图和更新日志 这些页面纳入 Git 版本控制，确保容器重建后不会丢失。\\n"`},{title:'"运维指南"',url:'"/projects/robotdaily/ops/"',date:'"2026-03-12"',summary:'"部署 Docker Compose version: \\u0026#39;3.8\\u0026#39; services: robotdaily: build: ./deploy volumes: - ./site:/app environment: - ARXIV_API_KEY=${ARXIV_API_KEY} - DISCORD_BOT_TOKEN=${DISCORD_BOT_TOKEN} nginx: image: nginx:alpine ports: - \\u0026#34;80:80\\u0026#34; volumes: - ./site/public:/usr/share/nginx/html:ro 本地开发 cd skills/robdaily hugo server -D -F 日常维护 每日自动推送 时间：每天 10:30 触发：cron 作业或手动执行 scripts/run_daily.py 输出：Discord Embed + Hugo Markdown 归档 日志查看 docker logs robotdaily-arxiv-digest 故障排查 Discord 推送失败 检查 DISCORD_BOT_TOKEN 是否有效 验证 Webhook URL 权限 查看日志中的 HTTP 状态码 Hugo 构建失败 检查模板语法错误 验证 Markdown 文件格式 清理并重新构建：hugo --cleanDestinationDir "',tags:"null",content:'"部署 Docker Compose version: \\u0026#39;3.8\\u0026#39; services: robotdaily: build: ./deploy volumes: - ./site:/app environment: - ARXIV_API_KEY=${ARXIV_API_KEY} - DISCORD_BOT_TOKEN=${DISCORD_BOT_TOKEN} nginx: image: nginx:alpine ports: - \\u0026#34;80:80\\u0026#34; volumes: - ./site/public:/usr/share/nginx/html:ro 本地开发 cd skills/robdaily hugo server -D -F 日常维护 每日自动推送 时间：每天 10:30 触发：cron 作业或手动执行 scripts/run_daily.py 输出：Discord Embed + Hugo Markdown 归档 日志查看 docker logs robotdaily-arxiv-digest 故障排查 Discord 推送失败 检查 DISCORD_BOT_TOKEN 是否有效 验证 Webhook URL 权限 查看日志中的 HTTP 状态码 Hugo 构建失败 检查模板语法错误 验证 Markdown 文件格式 清理并重新构建：hugo --cleanDestinationDir "'},{title:'"项目路线图"',url:'"/projects/robotdaily/roadmap/"',date:'"2026-03-12"',summary:'"当前阶段 (2026-Q1) ✅ 已完成 arXiv 论文抓取管道 Discord Embed 卡片推送 Hugo 静态站点基础架构 项目管理层页面 🚧 进行中 论文质量评分算法 历史数据归档查询 Docker 镜像优化 📅 计划中 多源支持 (Semantic Scholar, PubMed) 邮件订阅功能 移动端适配优化 长期目标 知识图谱: 构建论文关系网络 趋势分析: 研究领域热点追踪 个性化推荐: 基于用户兴趣的论文过滤 "',tags:"null",content:'"当前阶段 (2026-Q1) ✅ 已完成 arXiv 论文抓取管道 Discord Embed 卡片推送 Hugo 静态站点基础架构 项目管理层页面 🚧 进行中 论文质量评分算法 历史数据归档查询 Docker 镜像优化 📅 计划中 多源支持 (Semantic Scholar, PubMed) 邮件订阅功能 移动端适配优化 长期目标 知识图谱: 构建论文关系网络 趋势分析: 研究领域热点追踪 个性化推荐: 基于用户兴趣的论文过滤 "'},{title:'"更新日志"',url:'"/projects/robotdaily/changelog/"',date:'"2026-03-12"',summary:'"2026-03-12 新增 Hugo 项目管理层页面结构 架构设计文档 运维指南 项目路线图 改进 Discord 推送卡片化 (Embed 格式) Hugo 站点目录重构 每日 Markdown 纳入 Git 版本控制 2026-03-10 新增 论文质量筛选算法 LLM 中文摘要生成 关键词标签提取 修复 HTTP 403 拦截问题 LaTeX 渲染异常 2026-03-08 初始版本 arXiv API 集成 Discord 机器人推送 基础管道搭建 "',tags:"null",content:'"2026-03-12 新增 Hugo 项目管理层页面结构 架构设计文档 运维指南 项目路线图 改进 Discord 推送卡片化 (Embed 格式) Hugo 站点目录重构 每日 Markdown 纳入 Git 版本控制 2026-03-10 新增 论文质量筛选算法 LLM 中文摘要生成 关键词标签提取 修复 HTTP 403 拦截问题 LaTeX 渲染异常 2026-03-08 初始版本 arXiv API 集成 Discord 机器人推送 基础管道搭建 "'},{title:'"2026-03-12 · AI 每日简报"',url:'"/ai-daily/2026-03-12/"',date:'"2026-03-12"',summary:'"RobotDaily 2026-03-12：共 8 篇，含 具身智能 3 篇，表征学习 3 篇，强化学习 2 篇。"',tags:'["robotdaily","ai-daily","具身智能","表征学习","强化学习","llm"]',content:`" Hugo 归档版，来源于 RobotDaily 当日 Markdown 简报。\\nRobotDaily 2026-03-12：共 8 篇，含 具身智能 3 篇，表征学习 3 篇，强化学习 2 篇。\\n偏应用导向精选，按方向整理成短卡片式 Markdown 归档。\\n具身智能（3 篇） 1. Learning Adaptive Force Control for Contact-Rich Sample Scraping with Heterogeneous Materials 提出自适应力控框架，结合阻抗控制与强化学习，解决异质材料刮取任务，仿真到现实迁移效果显著。\\n作者：Cenk Cetin, Shreyas Pouli, Gabriella Pizzuto 标签：自适应力控 强化学习 仿真到现实 机器人操作 中文摘要：全球挑战加速了科学发现的需求，推动了AI驱动机器人技术的发展。在以人为中心的实验室中部署机器人化学家是自主发现的关键，因为复杂任务仍需人类科学家的灵巧性。机器人操作面临处理多样化化学物质（颗粒、粉末或粘性液体）的挑战。例如，人类使用刮刀从瓶壁刮取材料，自动化此过程需在受限环境中执行精细运动。我们提出自适应控制框架，结合低级笛卡尔阻抗控制器实现稳定交互，高级强化学习代理动态调整末端接触力。代理通过感知反馈获取材料位置。我们构建了包含Franka Research 3机器人、刮刀和异质材料的仿真环境，样本建模为球体集合，每个球体分配唯一脱附力阈值，通过Perlin噪声生成。代理在仿真中学习自适应策略，并成功迁移至真实机器人。在五种材料设置中评估，方法平均优于固定力矩基线10.9%。 链接：DOI | arXiv | PDF 2. Learning Bimanual Cloth Manipulation with Vision-based Tactile Sensing via Single Robotic Arm 提出单臂双手机器人布料操作框架，结合视觉触觉感知与合成数据生成，实现高精度布料展开，降低硬件成本。\\n作者：Dongmyoung Lee, Wei Chen, Xiaoshuai Chen, Rui Zong 等另外1人 标签：布料操作 视觉触觉 单臂双手机器人 合成数据生成 中文摘要：机器人布料操作因织物的高维状态空间、可变形性及频繁遮挡而具有挑战性。双臂系统虽能缓解部分问题，但增加了硬件和控制复杂度。本文提出Touch G.O.G.，一种紧凑的视觉触觉夹爪及感知控制框架，用于单臂双手机器人布料操作。该框架包含三个关键组件：(1)新型夹爪设计及控制策略，实现单臂夹爪内布料滑动；(2)基于视觉基础模型的Vision Transformer管道，用于布料部分分类（PC-Net）和边缘位姿估计（PE-Net），使用真实和合成触觉图像；(3)编码器-解码器合成数据生成器（SD-Net），通过生成高保真触觉图像减少人工标注。实验显示边缘、角落、内部区域及抓取失败区分准确率达96%，边缘定位亚毫米级，方向误差4.5°。真实世界结果表明，仅用单臂即可可靠展开皱褶布料。这些结果突显Touch G.O.G.作为可变形物体操作的紧凑且经济有效的解决方案。 链接：DOI | arXiv | PDF 3. FAR-Dex: Few-shot Data Augmentation and Adaptive Residual Policy Refinement for Dexterous Manipulation 通过少样本数据增强与自适应残差优化，解决灵巧操作数据稀缺问题，显著提升真实任务成功率与泛化能力。\\n作者：Yushan Bai, Fulin Chen, Hongzheng Sun, Yuchuang Tong 等另外2人 标签：灵巧操作 少样本学习 数据增强 分层框架 中文摘要：通过多指手与机械臂的协作实现类人灵巧操作是机器人领域的长期挑战，主要由于高质量演示稀缺和高维动作空间复杂。为此，提出FAR-Dex，一个结合少样本数据增强与自适应残差优化的分层框架，实现灵巧任务中稳健精确的臂手协调。首先，FAR-DexGen利用IsaacLab模拟器从少量演示生成多样且物理约束的轨迹，为策略训练提供数据基础。其次，FAR-DexRes引入自适应残差模块，通过结合多步轨迹片段与观测特征优化策略，提升操作场景的准确性和鲁棒性。仿真与真实实验表明，FAR-Dex相比最先进方法数据质量提升13.4%，任务成功率提高7%，并在真实任务中实现超过80%的成功率，具备强位置泛化能力。 链接：DOI | arXiv | PDF 表征学习（3 篇） 1. UAV traffic scene understanding: A cross-spectral guided approach and a unified benchmark 提出跨光谱交通认知网络，结合光热模态与交通规则知识，提升恶劣环境下的理解能力，并发布首个光热红外交通问答基准。\\n作者：Yu Zhang, Zhicheng Zhao, Ze Luo, Chenglong Li 等另外1人 标签：无人机 交通场景理解 跨光谱融合 视觉问答 中文摘要：无人机交通场景理解对智能交通系统至关重要，但现有方法依赖光学图像，在夜间和雾天等恶劣光照下性能严重下降。此外，现有视觉问答模型仅限于基础感知任务，缺乏评估复杂交通行为的领域特定监管知识。为此，我们提出跨光谱交通认知网络（CTCNet），设计原型引导知识嵌入模块，利用外部交通规则记忆中的高层语义原型将领域知识锚定到视觉表示中，使模型能理解复杂行为并区分细粒度交通违规。同时，开发质量感知光谱补偿模块，利用光学和热成像模态的互补特性进行双向上下文交换，有效补偿退化特征。此外，构建首个大规模光热红外认知无人机交通理解基准Traffic-VQA，包含8,180对对齐图像和130万问答对，涵盖31种类型。实验表明CTCNet在认知和感知场景中显著优于现有方法。 链接：DOI | arXiv | PDF 2. MapGCLR: Geospatial Contrastive Learning of Representations for Online Vectorized HD Map Construction 利用地理空间一致性构建自监督信号，显著降低在线建图标注成本，提升特征表示质量。\\n作者：Jonas Merkert, Alexander Blumberg, Jan-Hendrik Pauls, Christoph Stiller 标签：在线高精地图 自监督学习 地理空间对比 BEV 表征 中文摘要：自动驾驶依赖高精地图感知环境，但离线建图成本高昂。在线矢量建图仅需训练时标注，而自监督学习可进一步减少标签需求。本文提出 MapGCLR，通过在对比损失中强制重叠鸟瞰图（BEV）特征网格的地理空间一致性，优化在线矢量建图模型的 latent BEV 特征表示。为确保对比对具有地理重叠，我们分析数据集中轨迹的重叠关系，并按可调多轨迹要求生成子数据集划分。模型在减少的单轨迹标注数据上进行监督训练，并在符合多轨迹要求的更大无标签数据上进行自监督训练，形成半监督框架。该方法在矢量地图感知性能（定量）及 BEV 特征空间 PCA 可视化分割效果（定性）上均优于纯监督基线。 链接：DOI | arXiv | PDF 3. Lifelong Imitation Learning with Multimodal Latent Replay and Incremental Adjustment 首创多模态潜在回放机制，显著降低遗忘率并提升连续任务适应效率，具高落地价值。\\n作者：Fanqi Yu, Matteo Tiezzi, Tommaso Apicella, Cigdem Beyan 等另外1人 标签：终身学习 模仿学习 多模态表征 潜在回放 中文摘要：本文提出一种终身模仿学习框架，在真实内存与数据约束下实现序列任务的持续策略优化。该方法摒弃传统经验回放，完全在多模态潜在空间操作，存储并复用视觉、语言及机器人状态的紧凑表征以支持未来学习。为进一步稳定适应过程，引入增量特征调整机制，通过角度间隔约束正则化任务嵌入的演化，保持任务间区分性。该方法在 LIBERO 基准上确立新状态，AUC 提升 10-17 个点，遗忘率较此前领先方法降低高达 65%。消融实验证实各组件有效性，显示优于替代策略的一致增益。 链接：DOI | arXiv | PDF 强化学习（2 篇） 1. UAV-MARL: Multi-Agent Reinforcement Learning for Time-Critical and Dynamic Medical Supply Delivery 提出基于MARL的无人机医疗配送框架，通过PPO实现动态资源分配与任务优先级管理，适用于紧急场景。\\n作者：Islam Guven, Mehmet Parlak 标签：多智能体强化学习 无人机配送 医疗物流 PPO 中文摘要：无人机（UAV）在紧急医疗物资配送中发挥重要作用，但需协调机制以优先处理请求、分配有限资源并适应不确定条件。本文提出多智能体强化学习（MARL）框架，用于协调随机医疗配送场景中的无人机编队，其中请求的紧急程度、位置和截止时间各异。问题建模为部分可观测马尔可夫决策过程（POMDP），无人机在通信和定位限制下保持对需求的感知。框架采用近端策略优化（PPO）作为主要算法，评估异步扩展、经典演员-评论家方法及架构修改，以分析可扩展性与性能权衡。模型基于OpenStreetMap的真实地理数据验证，提供决策支持层以优先处理医疗任务、实时重分配资源并协助医护人员管理紧急物流。实验表明，经典PPO在协调性能上优于异步和顺序学习策略，突显了强化学习在自适应、可扩展无人机辅助医疗物流中的潜力。 链接：DOI | arXiv | PDF 2. Emerging Extrinsic Dexterity in Cluttered Scenes via Dynamics-aware Policy Learning 显式建模接触动力学使机器人无需人工规则即可在杂乱环境中自主涌现非抓持操作，显著提升实机成功率与部署实用性。\\n作者：Yixin Zheng, Jiangran Lyu, Yifan Zhang, Jiayi Chen 等另外7人 标签：非抓持操作 动力学感知 世界模型 强化学习 中文摘要：利用环境接触的非抓持灵巧操作可突破传统抓持局限，但在杂乱场景中因多物体耦合动力学难以实现。现有方法缺乏显式动力学建模，导致非抓持操作性能不足。本文提出动力学感知策略学习框架，通过显式世界模型学习接触诱导的物体动力学表征，并以此条件化强化学习，无需手工设计接触启发式或复杂奖励函数即可涌现非抓持灵巧性。仿真与实机实验表明，该方法在未见杂乱场景成功率上超抓持操作、遥操作及 prior 表征策略 25% 以上；实机在 10 个杂乱场景成功率约 50%，杂货店部署验证了稳健的 sim-to-real 迁移能力。 链接：DOI | arXiv | PDF "`},{title:'"[项目名称]"',url:'"/projects/_template/"',date:'"2026-03-12"',summary:'"一句话描述项目"',tags:'["project"]',content:`"📑 目录 项目概述 技术栈 项目状态 核心功能 架构设计 部署与运维 更新日志 相关链接 项目概述 一句话描述项目的核心功能和目标。\\n技术栈 主要技术：Python、Node.js、Docker 等 工具链：Git、CI/CD、监控等 依赖服务：数据库、API、消息队列等 项目状态 当前状态：🟢 运行中 / 🟡 开发中 / 🔴 规划中\\n核心功能 功能点 1 描述功能 1 的详细信息。\\n功能点 2 描述功能 2 的详细信息。\\n架构设计 简要说明项目架构和关键组件。\\n├── 模块 A ├── 模块 B └── 模块 C 部署与运维 部署方式：Docker / Kubernetes / 云服务 监控日志：Prometheus / Grafana / ELK 备份策略：定期备份、恢复演练 更新日志 v1.0.0 (2026-03-12) ✅ 初始版本发布 ✅ 核心功能完成 v0.9.0 (2026-03-10) 🚧 开发中功能 相关链接 Gogs 仓库 在线文档 Demo 演示 最后更新：2026-03-12\\n"`},{title:'"个人简历（占位）"',url:'"/resume/profile/"',date:'"2026-03-12"',summary:'"这里放你的个人经历、技能栈和项目摘要。"',tags:'["resume"]',content:`"1 个人简介 这里先放一版占位内容，后面你可以直接按 Markdown 自己补。\\n2 技能栈 方向：AI / 机器人 / 自动化内容生产 工具：Python、Node.js、Docker、Hugo 3 项目管理 本页面汇总所有项目的核心信息与文档链接。每个项目都有独立的文档页面，包含完整的技术细节、架构设计和运维说明。\\n3.1 RobotDaily AI 每日论文简报系统\\n描述：自动化论文抓取、筛选、解读与多平台推送系统 技术栈：Python、arXiv API、LLM、Discord、Hugo 状态：🟢 运行中 Gogs 仓库：https://code.indigofloyd.space/ClawLab/RobotDaily 项目文档：查看详情 3.2 个人站 Hugo 静态博客平台\\n描述：个人站：收纳 AI 每日简报、博客和简历 技术栈：Hugo、CSS3、响应式设计 状态：🟢 运行中 Gogs 仓库：https://code.indigofloyd.space/ClawLab/RobotDaily 项目文档：查看详情 3.3 [项目名称] 一句话描述项目\\n描述：项目的核心功能和目标 技术栈：主要技术/工具 状态：🟢 运行中 / 🟡 开发中 / 🔴 规划中 Gogs 仓库：https://code.indigofloyd.space/[你的用户名]/[项目名] 项目文档：查看详情 4 联系方式 这里补你的邮箱、GitHub、社媒即可。\\n"`},{title:'"站点初始化说明"',url:'"/blog/welcome/"',date:'"2026-03-12"',summary:'"个人站已经按 AI 简报 / Blog / 简历 三个分区拆开。"',tags:'["hugo","setup"]',content:`"这个 Hugo 站点已经按三个区域拆开：\\nAI 每日简报 Blog 简历 这样 RobotDaily 继续走自动发布，你的个人内容也能独立维护。\\n"`},{title:'"2026-03-11 · AI 每日简报"',url:'"/ai-daily/2026-03-11/"',date:'"2026-03-11"',summary:'"RobotDaily 2026-03-11：共 9 篇，含 具身智能 3 篇，表征学习 3 篇，强化学习 3 篇。"',tags:'["robotdaily","ai-daily","embodied","具身智能","representation","表征学习","reinforcement","强化学习","llm"]',content:`" Hugo 归档版，来源于 RobotDaily 当日 Markdown 简报。\\nRobotDaily 2026-03-11：共 9 篇，含 具身智能 3 篇，表征学习 3 篇，强化学习 3 篇。\\n偏应用导向精选，按方向整理成短卡片式 Markdown 归档。\\n具身智能（3 篇） 1. PlayWorld: Learning Robot World Models from Autonomous Play 关键词命中 real world, deployed, world model, scalable，应用信号: real world, deployed, robot；创…\\n作者：Tenny Yin, Zhiting Mei, Zhonghe Zheng, Miyu Yamane 等另外7人 标签：具身智能 机器人 真实部署 操控 中文摘要：【LLM 暂不可用，先保留英文摘要要点】Action-conditioned video models offer a promising path to building general-purpose robot simulators that can improve directly from data. Yet, despite training on large-scale robot datasets, current s… 链接：DOI | arXiv | PDF 2. MetaWorld-X: Hierarchical World Modeling via VLM-Orchestrated Experts for Humanoid Loco-Manipulation 关键词命中 robot, robotic, world model，应用信号: robot, robotic, system；创新信号: world model；领域匹配…\\n作者：Yutong Shen, Hangxu Liu, Penghui Liu, Jiashuo Luo 等另外5人 标签：具身智能 机器人 真实部署 操控 中文摘要：【LLM 暂不可用，先保留英文摘要要点】Learning natural, stable, and compositionally generalizable whole-body control policies for humanoid robots performing simultaneous locomotion and manipulation (loco-manipulation) remains a fundament… 链接：DOI | arXiv | PDF 3. Embodied Human Simulation for Quantitative Design and Analysis of Interactive Robotics 关键词命中 robot, robotic, scalable，应用信号: robot, robotic, system；创新信号: scalable；领域匹配: embo…\\n作者：Chenhui Zuo, Jinhao Xu, Michael Qian Vergnolle, Yanan Sui 标签：具身智能 机器人 真实部署 操控 中文摘要：【LLM 暂不可用，先保留英文摘要要点】Physical interactive robotics, ranging from wearable devices to collaborative humanoid robots, require close coordination between mechanical design and control. However, evaluating interactive dynami… 链接：DOI | arXiv | PDF 表征学习（3 篇） 1. $M^2$-Occ: Resilient 3D Semantic Occupancy Prediction for Autonomous Driving with Incomplete Camera Inputs 关键词命中 real-world, deployment, first，应用信号: real-world, deployment, system；创新信号: first；…\\n作者：Kaixin Lin, Kunyu Peng, Di Wen, Yufan Chen 等另外2人 标签：表征学习 潜在空间 世界模型 预训练 中文摘要：【LLM 暂不可用，先保留英文摘要要点】Semantic occupancy prediction enables dense 3D geometric and semantic understanding for autonomous driving. However, existing camera-based approaches implicitly assume complete surround-view observat… 链接：DOI | arXiv | PDF 2. Emerging Extrinsic Dexterity in Cluttered Scenes via Dynamics-aware Policy Learning 关键词命中 real-world, real world, world model，应用信号: real-world, real world, deployment；创新…\\n作者：Yixin Zheng, Jiangran Lyu, Yifan Zhang, Jiayi Chen 等另外7人 标签：表征学习 潜在空间 世界模型 预训练 中文摘要：【LLM 暂不可用，先保留英文摘要要点】Extrinsic dexterity leverages environmental contact to overcome the limitations of prehensile manipulation. However, achieving such dexterity in cluttered scenes remains challenging and underexplored… 链接：DOI | arXiv | PDF 3. From Semantics to Pixels: Coarse-to-Fine Masked Autoencoders for Hierarchical Visual Understanding 关键词命中 dataset, self-supervised, first，应用信号: dataset；创新信号: self-supervised, first；领域匹配…\\n作者：Wenzhao Xiang, Yue Wu, Hongyang Yu, Feng Gao 等另外2人 标签：表征学习 潜在空间 世界模型 预训练 中文摘要：【LLM 暂不可用，先保留英文摘要要点】Self-supervised visual pre-training methods face an inherent tension: contrastive learning (CL) captures global semantics but loses fine-grained detail, while masked image modeling (MIM) preserves lo… 链接：DOI | arXiv | PDF 强化学习（3 篇） 1. SPAARS: Safer RL Policy Alignment through Abstract Exploration and Refined Exploitation of Action Space 关键词命中 robot, robotic，应用信号: robot, robotic；领域匹配: reinforcement learning, policy gradie…\\n作者：Swaminathan S K, Aritra Hazra 标签：强化学习 策略优化 奖励设计 离线RL 中文摘要：【LLM 暂不可用，先保留英文摘要要点】Offline-to-online reinforcement learning (RL) offers a promising paradigm for robotics by pre-training policies on safe, offline demonstrations and fine-tuning them via online interaction. However, a… 链接：DOI | arXiv | PDF 2. Robust Regularized Policy Iteration under Transition Uncertainty 关键词命中 benchmark, unified，应用信号: benchmark；创新信号: unified；领域匹配: reinforcement learning,…\\n作者：Hongqiang Lin, Zhenghui Fu, Weihao Tang, Pengfei Wang 等另外3人 标签：强化学习 策略优化 奖励设计 离线RL 中文摘要：【LLM 暂不可用，先保留英文摘要要点】Offline reinforcement learning (RL) enables data-efficient and safe policy learning without online exploration, but its performance often degrades under distribution shift. The learned policy may vis… 链接：DOI | arXiv | PDF 3. Towards Batch-to-Streaming Deep Reinforcement Learning for Continuous Control 关键词命中 benchmark, hardware, novel，应用信号: benchmark, hardware, sim2real；创新信号: novel；领域匹配…\\n作者：Riccardo De Monte, Matteo Cederle, Gian Antonio Susto 标签：强化学习 策略优化 奖励设计 离线RL 中文摘要：【LLM 暂不可用，先保留英文摘要要点】State-of-the-art deep reinforcement learning (RL) methods have achieved remarkable performance in continuous control tasks, yet their computational complexity is often incompatible with the constrain… 链接：DOI | arXiv | PDF "`}],options={includeScore:!0,threshold:.4,location:0,distance:100,maxPatternLength:32,minMatchCharLength:1,keys:[{name:"title",weight:.5},{name:"content",weight:.3},{name:"tags",weight:.2}]},fuse=new Fuse(posts,options);document.getElementById("search-input").addEventListener("input",function(e){const n=e.target.value.trim(),t=document.getElementById("search-results");if(!n){t.innerHTML="";return}const s=fuse.search(n);if(s.length===0){t.innerHTML='<p class="no-results">没有找到匹配的内容</p>';return}t.innerHTML=s.slice(0,10).map(e=>{const t=e.item,n=t.tags?t.tags.map(e=>`<span class="tag">${e}</span>`).join(""):"",s=t.summary.replace(/<[^>]*>/g,"").substring(0,150)+"...";return`
        <article class="search-result-item">
          <h3><a href="${t.url}">${t.title}</a></h3>
          <p class="meta">${t.date}</p>
          <p class="preview">${s}</p>
          <div class="tags">${n}</div>
        </article>
      `}).join("")})</script></main><footer class="site-footer wrap"><p>© 2026 IndigoFloyd · Hugo personal site for AI briefs / blog / resume.</p></footer><script>document.addEventListener("DOMContentLoaded",function(){const e=document.querySelector(".menu-toggle"),t=document.querySelector(".site-nav");e.addEventListener("click",function(){const n=e.classList.toggle("active");t.classList.toggle("active"),e.setAttribute("aria-expanded",n)})})</script></body></html>