文章详情
生数科技与清华大学联合研发的统一世界模型Motus近日正式开源,这一成果在具身智能领域引发广泛关注。该模型以视频大模型为基础架构,在多...
2026-02-22 16:20:05
文章详情介绍
生数科技与清华大学联合研发的统一世界模型Motus近日正式开源,这一成果在具身智能领域引发广泛关注。该模型以视频大模型为基础架构,在多项核心任务中展现出显著优势,较国际主流VLA模型Pi0.5成功率提升约40%,为具身智能的规模化扩展提供了可行路径。
研究团队指出,视频数据天然包含物理世界的时空结构、因果关系与动态变化,是连接感知与行动的关键多模态载体。Motus突破传统具身智能系统"感知-推理-行动"的模块化设计,通过统一框架整合了VLA、世界模型、视频生成模型等五类基础范式,构建了从感知到执行的端到端建模路径。这种一体化设计使其区别于侧重仿真渲染的同类模型,可直接应用于物理机器人执行。
针对具身智能领域长期存在的真机数据稀缺问题,Motus创新性地统一了跨本体机器人数据、仿真数据、人类操作视频等多元数据源的动作空间。通过大规模预训练,模型学习到通用运动先验知识,在跨任务和跨平台场景中展现出强大的泛化能力。实验数据显示,在50个任务的数据规模扩展测试中,Motus平均成功率较Pi0.5提升35.1个百分点,数据效率达到对比模型的13.55倍。
在任务复杂度测试中,Motus的优势更为突出。随着任务数量增加,其成功率持续上升,而对比模型出现明显下降,最终成功率差距达37个百分点。在RoboTwin 2.0仿真环境的50个任务评测中,模型取得约88%的平均成功率,部分高难度操作任务的成功率显著优于现有基线模型。真实机器人平台部署测试进一步验证了其跨本体迁移能力。
该成果的开源包含完整代码、研究论文和模型权重,已在GitHub、Hugging Face等平台公开。生数科技表示,Motus的发布旨在为具身智能领域提供统一的基础模型方案,推动行业从模块化系统向统一智能体架构演进。值得注意的是,这项研究早于行业同类成果约两个月完成论文发布与开源,其技术路线选择与实施效率均体现出领先性。
此前,合作团队已于2025年7月提出Vidar具身视频模型,围绕"视频模型作为统一表征底座"的技术方向展开探索。Motus的研发延续了这一技术脉络,通过整合视频生成、逆动力学建模等能力,形成了更完整的具身智能解决方案。这种技术演进路径为解决机器人学习中的数据瓶颈问题提供了新思路。
最新星火攻略
更多- 阴阳师式神SP梦引蝴蝶精强度详解指南
- 英飞凌4月起上调电源开关与IC元件价格,AI需求增长或成涨价主因
- 比亚迪天神之眼B或全系选装,小车也能享高阶智驾,友商压力来了?
- 我国网民规模达11.25亿人!互联网普及率突破80%
- 李想畅谈汽车未来:全新理想L9以完整技术栈,开启具身智能机器人新纪元
- 奥尔特曼公开炮轰 Anthropic:超级碗广告“撒谎”,搞双标话术
- 八方旅人0书籍封纹钥匙获取指南
- 燕云十六声不可道面饰获取指南
- 超级机器人大战Y必练机体选择推荐
- OpenAI首款硬件Dime曝光:转向耳机形态,成本考量下2026年或入市
- 龙魂旅人庞培玩法指南
- 全球芯片需求持续升温,美半导体协会预测2026年销售额将破万亿美元大关
- 低浓度抗生素的“隐形之手”:水生生态的微妙危机与科学应对
- 万亿新基建助力 国产IO部件突破技术瓶颈 开启高密度升级新篇章
- 润和软件华为大会发布DeepSeek一体机,软硬协同加速AI大模型行业应用
最新星火智能
更多- 2025年我国互联网发展“新”意盎然:普及率超八成 AI应用加速渗透
- 消息称前云度汽车CEO林密已低调再创业
- 天外世界2金色武器泽晶终结者如何获取
- 远光84改装配件推荐指南
- 探访模速空间:与AI内行人对话,共话人与智能的未来图景
- 面壁智能李大海:全模态引领人机交互变革,具身智能或两三年迎跃迁
- 国产算力新飞跃!全国首个3万卡超集群上线,AI大模型迎来“超强粮仓”
- 风投巨头 a16z 狂揽 17 亿美元,重金押注 AI 算力底座
- 第三代飞行除冰机器人实战首秀:0.3秒挂载,恶劣天气高效护线
- 望月月灵疾尾雀属性介绍指南
- 八部门发力中药工业:AI赋能新药研发 突破关键技术促创新改良
- 明日方舟终末地小红帽技能连招教学
- 魔法工艺巨灵叠血玩法指南
- 面壁智能MiniCPM-o4.5全模态模型来袭:边感知边对话 开启AI新交互
- 明日方舟终末地仓储节点介绍指南
最新星火游戏
更多