会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 智元机器人:发布行业首个机器人世界模型开源平台Genie Envisioner!

智元机器人:发布行业首个机器人世界模型开源平台Genie Envisioner

时间:2025-12-18 05:26:43 来源:TMGM官方平台 作者:时尚 阅读:462次

XM外汇官网APP获悉,智元智元机器人推出了面向真实世界机器人操控的机器世界模型平台——Genie Envisioner(GE)。与传统的布行“数据—训练—评估”模式不同,GE首次将未来帧预测、业首策略学习与仿真评估融合在以视频生成核心的个机闭环架构中,使机器人在同一模型下实现“看”、器人“想”、世界“动”的模型整合推理与执行。GE-Act基于3000小时的开源真实数据,显著提升了跨平台泛化和长时序任务的平台执行能力,为具身智能的智元发展提供了新的技术路径。

01

智元机器人:发布行业首个机器人世界模型开源平台Genie Envisioner

核心创新:

智元机器人:发布行业首个机器人世界模型开源平台Genie Envisioner

视觉中心的机器世界建模范式

智元机器人:发布行业首个机器人世界模型开源平台Genie Envisioner

GE的核心创新在于其视觉中心建模范式,直接在视觉空间中建模机器人与环境的布行交互,保留了空间结构和时序信息。业首这种方法带来了两个关键优势:

- 高效的个机跨本体泛化能力:GE-Act在新平台上只需1小时(约250个演示)的遥操作数据即可实现高质量任务执行,远超现有模型。通过在视觉空间学习的通用操控表征,模型能够快速适应不同平台。

- 长时序任务的精确执行能力:GE-Act在复杂的长时序任务中表现优异,如在纸盒折叠任务中,成功率达76%,而其他优化模型的表现均低于48%。这一能力得益于其未来时空预测和创新的稀疏记忆模块,帮助机器人保持关键历史信息,避免误差累积。

02

技术架构:三大核心组件

GE平台包括三个紧密集成的组件:

- GE-Base:多视角视频世界基础模型,通过自回归视频生成框架处理多个视角输入并保持空间一致性。基于约3000小时的真实数据,训练采用两阶段策略,确保模型对不同运动速度的鲁棒性。

- GE-Act:平行流匹配动作模型,拥有160M参数的轻量级架构,将GE-Base的视觉潜在表征转换为执行指令。其异步推理模式使得系统能够以200毫秒完成54步动作推理,实现实时控制。

- GE-Sim:层次化动作条件仿真器,将视觉预测扩展至动作条件,支持闭环策略评估。GE-Sim能够将低层控制指令转化为视觉预测,同时为策略优化提供高效的评估平台。

这三个组件相辅相成,共同构成了强大的视觉中心机器人学习平台。

EWMBench: 世界模型评测套件

为评估世界模型的质量,团队开发了EWMBench评测套件,采用多项指标全方位打分。与其他先进模型的对比中,GE-Base在视觉建模质量上取得最优成绩,验证了其可靠性。

(责任编辑:时尚)

相关内容
  • 中国工程院院士、深圳大学特聘教授范滇元:今日全面发展 明日国家栋梁
  • 真空包装≠绝对安全!多人网购肉制品致肉毒中毒,国家有关部门发布风险提示
  • i口岸丨4年1亿+人次!这个24小时通关的“智慧口岸” ,刷新全国纪录!
  • 广西再通报女生遭欺凌:校长、副校长等多人被停职
  • 高质量发展,质量安全先行!——“我要飞”学员赴京争取质量安全先行先试任务
  • 稳居全国第一!广东经营主体总量突破2000万户
  • 乘客发视频炫耀“第N次”带打火机登机,四川警方通报
  • 传承红色旋律,共赏国乐华章!“艺珠海”国乐赏析音乐会奏响鱼月村
推荐内容
  • 梅州海关供港澳活猪远程检疫监装模式正式启动
  • i口岸丨青茂口岸开通四周年,进出境旅客量平均年增长率超80%
  • 首架C909医疗机交付
  • 重温抗战岁月 国博展出700余件套抗战相关实物与照片
  • 中山农业科技特派员下沉一线,为水产养殖注入绿色动能
  • 促进农用地集中连片流转丨市委书记抓乡村振兴(2025.09.01