热点资讯
开yun体育网通过微规模器及时退换为关节角度-开云(中国)Kaiyun·官方网站 登录入口
发布日期:2025-08-10 12:23 点击次数:75
《环太平洋》名时势之"用真东谈主驾御机甲"开yun体育网,如今照进推行了。
话未几说,请看 VCR:
蓝本,这是上海 AI Lab 最新推出的东谈主形机器东谈主"驾驶舱"——HOMIE(Humanoid Loco-Manipulation with Isomorphic Exoskeleton Cockpit) 。
一副机械臂外骨骼、一对四肢感应手套,以及一块三轴脚踏板,东谈主们就能对双足东谈主形机器东谈主全身进行精确遥操作了。
这也意味着,无需腾贵四肢捕捉设立,东谈主形机器东谈主也能 1:1 复刻东谈主类四肢。
笔据计划团队的说法,HOMIE 主打一个"快准省":
快:与传统最快 VR 手柄汇聚决策比较,速率还要快200%,任务完成时辰裁减50%;
准:贬责了传统东谈主形机器东谈主遥操作濒临的全身谐和规模难(需同期规模出动与操作)和高精度指示获取难(依赖腾贵动捕设立或视觉算法)两浩劫题,撑持其完成搬运、配合、开门等复杂出动操作任务;
省:整套硬件仅约3500 元东谈主民币,而且 HOMIE还开源了。
该系统由强化学习驱动的通顺规模框架和低老本同构外骨骼硬件构成,初度结束了单一操作家对双足东谈主形机器东谈主全身的精确遥操作。
由强化学习驱动的通顺规模框架
这第一步,咱们先来拆个箱,精采康康上头提到的"三件套"。
三大中枢组件
一直以来,传统东谈主形机器东谈主遥操作濒临两浩劫题:
全身谐和规模难:需同期规模出动与操作
高精度指示获取难:依赖腾贵动捕设立或视觉算法
而 HOMIE 的打破在于将"东谈主机同构"理念施展到极致,其驾驶舱包含三大中枢组件:
1、同构机械臂外骨骼:7 解放度机械臂与机器东谈主关节逐一对应,操作家只需像规模我方手臂一样通顺,即可精确映射机器东谈主四肢,误差小于 0.09 度,频率高达 260Hz。
2、四肢感应手套:15 解放度传感器捕捉手指狭窄四肢,霍尔效应磁感技能结束低老本高精度(200 东谈主民币 / 只),可适配多种颖慧手型号。
3、三轴脚踏板:通过踏板规模机器东谈主出动速率、转向与下蹲高度,撑持"踩油门式"直观操作。
挨个来看的话。
同构外骨骼机械臂是基于 Unitree G1 与 Fourier GR-1 机器东谈主花样定制,7 解放度关节与机器东谈主十足对应。
它接收 Dynamixel 伺服电机(精度 0.09 °),通过 URDF 模子对都坐标系,确保操作家四肢与机器东谈主通顺 1:1 映射。
世俗情况下,它被固定于操作家背部与手掌,遮掩机器东谈主绝大部单干作空间且不甩手东谈主体行为。
至于 200 元 / 只的四肢感应手套,它每根手指配备 3 组霍尔传感器,捕捉指尖辗转、指节偏转等 15 解放度四肢。
同期,磁铁随关节旋转调动磁场强度,通过微规模器及时退换为关节角度,撑持即插即用适配多种颖慧手。
而眼下踩的三轴脚踏板,不错看到线性速率、转向角速率、下蹲高度辩认由三个踏板规模,压力信号经高精度电位器退换。
对了,模式切换按钮撑持前进 / 后退、左转 / 右转快速切换,操作逻辑近似汽车油门。
以上想象能够让操作家如同"一稔"机器东谈主,透顶解脱传统 VR 手柄的延伸与误差。
实验扫尾清楚,HOMIE 的指示汇聚速率比最快 VR 决策快 200%,任务完成时辰裁减 50%。尤其当操作家伸手持取物体时,机器东谈主险些同步反馈。
而且,背后团队额外辅导:
由于外骨骼基于同构观念想象,仅手臂部分需要笔据不同机器东谈主的手臂想象进行微调;不外因为现行东谈主形机器东谈主手臂想象基本是 7 解放度的范式,因此这个调治并不会很大。
手套和踏板部分对统统市面上的东谈主形机器东谈主都是通用的。
其次,咱们来要点谈谈 HOMIE 背后所接收的强化学习。
在强化学习框架中引入三大立异技能
现存的强化学习纰谬无法让东谈主形机器东谈主安稳、快速地下蹲到指定位置,同期现存纰谬均依赖于多半数据和通顺先验来实验机器东谈主通顺对上身姿势的适配。
前者很猛进度甩手了机器东谈主的可操作空间,后者则提高了机器东谈主教授的老本。
为了最猛进度拓展机器东谈主的操作空间,并保证任何机器东谈主都能快速学会在职何上身姿势下保持均衡,HOMIE 在其强化学习框架中引入三大立异技能:
1、上半身姿势课程学习
传统纰谬径直随即采样上身关节角度,教授初期机器东谈主时时失衡,导致教授安然以致无法教授。而 HOMIE 引入了想象渐进式课程学习的纰谬,使得教授经由中机器东谈主上肢四肢的采样难度更平滑地提高:
来源阶段甩手上身四肢幅度(四肢比率 ra=0),此时粗略率上身姿势保持默许姿势,更容易训得安稳步态;
当速率追踪奖励达标后,逐渐扩大 ra 至 1,最终采样漫衍变为纯随即漫衍� � ( 0,1 ) ;
接收特殊概率漫衍平滑过渡,幸免四肢突变激发的失衡。
2、高度追踪奖励函数
为拓展机器东谈主操作空间(如从大地捡物或高处抛弃),HOMIE 在通用的追踪高度的奖励函数基础上引入了一个新的补助函数:
该函数通过膝关节角度与标的高度的动态耦合,指引机器东谈主自主调治蹲姿。
教授中,每次对号令的采样均保证有 1/3 环境专门学习下蹲,2/3 环境学习赠送行走,并吞个环境在两种模式下束缚切换,最终不错同期学会安稳的行走和下蹲。
3、对称性增强技能
为了充分行使东谈主形机器东谈主的把握对称性,幸免东谈主形机器东谈主把握不合称四肢易导致失衡,HOMIE 在数据汇聚与教授中引入镜像翻转:
将不雅测景况(关节角度、速率等)沿 x-z 平面镜像,生成对称样本。
在战略汇集优化时,独特蓄意对称四肢与价值的均方误差吃亏,强制汇集学习对称行为。
已通过从仿真到推行的全面考证
计划东谈主员针对 HOMIE 强化学习框架中提议的三个新的纰谬辩认进行了蒸馏实验,将得到的扫尾在几个纰谬办法上进行测试,最终发现:
1)上半身姿势课程学习不错充分匡助机器东谈主更快的学会在各式连气儿变化的上身姿势下保持均衡并安稳行走,而况 HOMIE 的课程学习容貌如实比径直行使随即概率进行课程学习愈加优胜;
2)高度追踪奖励函数的提议比较于只用高度追踪奖励函数,能够让机器东谈主更好、更快的学会安稳的下蹲,而节略奸巧的调大高度追踪奖励的奖励函数比例反而会让机器东谈主的学习愈加贫乏;
3)对称性增强技能的使用不啻让训得的战略愈加具有对称性,更是径直大幅提高了机器东谈主教授的速率,从而提高了数据恶果。
上述论断都标明,HOMIE 的教授框架很好的匡助机器东谈主更好的学习完成出动操作任务,不错使东谈主们取得更好的出动操作底层规模战略。
而且,HOMIE 不啻能应用于 Unitree G1,计划东谈主员还使用相似的框架教授了傅利叶 GR-1 机器东谈主。
扫尾讲明,即使 G1 和 GR-1 在结构和尺寸上判袂很大,HOMIE 的强化学习框架依然能够让 GR-1 快速学到安稳的行走和下蹲。
与此同期,计划东谈主员对 HOMIE 的硬件系统进行了系统性的测试,并发现成绩于舵机和霍尔传感器的使用,这套低老本的硬件系统具有极高的反馈频率和姿势获取精度。
同期由于同构的想象,系统不需要独特进行姿势忖度和求解,在无需 GPU 和 SoC 的前提下依然不错达到远超别的纰谬的姿势获取频率。
此外,计划团队行使 HOMIE 在不同环境下完成了丰富的出动操作任务。
包括从低货架拿货品到高货架、两东谈主辩认用 HOMIE 所有完成物体在两台机器东谈主之间的传递、货品搬运、推东谈主前进、开微波炉、捡水平、捧花等复杂的四肢,这些任务充分体现了 HOMIE 遥操东谈主形机器东谈主完成任务的各样性。
任务自己对机器东谈主全身谐和身手的高条目也讲明了行使 HOMIE 框架教授得到的战略的安稳性。
为了展示使用 HOMIE 的硬件系统进行桌面遥操任务的优胜性,计划东谈主员还在 4 项桌面任务中,用 HOMIE 和 VR 决策(OpenTelevision)辩认完成四个不同的桌面任务。
最终发现,HOMIE 在完成速率上具有显贵上风,尤其在需要精确径向出动的任务中完成速率跳动 VR 决策的2 倍。
同期,计划东谈主员还初步尝试了用 HOMIE 汇聚数据教授效法学习算法的可能性。
通过不才蹲捡苹果和赠送捡苹果两个任务上辩认汇聚 50 条数据,并行使 Seer 模子进行教授,从而部署到信得过机器东谈主上,最终取得了跳动 70%的成遵循。
玄虚而言,HOMIE 的价值不仅在于技能打破,更在于其开源与低老本特色(整套硬件仅约 3500 东谈主民币)。
现在主流的基于 VR 的纰谬是 OpenTelevision,是基于 Apple 的 VisionPro 进行操作,现在一台最基本的 256G 的 Vision Pro 国内售价约 3 万东谈主民币,因此其老本只须 VisionPro 的约 12%。
它让东谈主形机器东谈主解脱动捕依赖,像智高手机一样通过"直观化驾驶舱"走入仓库等复杂场景。
正如团队所言:
随机不久的畴前,每个机器东谈主都会领有我方的"神经相接驾驶舱",而 HOMIE 恰是这条征程上的第一块里程碑。
鉴于如故开源,出手身手强的小伙伴如故擦掌磨拳啰 ~
论文相接:
https://arxiv.org/abs/2502.13013
神情主页:
https://homietele.github.io/
代码恳求:
https://forms.gle/NSLiABo3bPWN89wZ8开yun体育网