文章详情
AIPress.com.cn报道2月6日消息,生数科技联合清华大学正式开源统一世界模型 Motus。该模型基于视频大模型构建,在多项核心具身智能任务中...
2026-02-17 09:55:02
文章详情介绍
AIPress.com.cn报道
2月6日消息,生数科技联合清华大学正式开源统一世界模型 Motus。该模型基于视频大模型构建,在多项核心具身智能任务中,相较国际主流 VLA 模型 Pi0.5,实现了约 40% 的成功率提升。研究团队表示,这一结果验证了具身基础模型在统一架构下进行规模化扩展(Scale Up)的可行路径。
据介绍,Motus 于 2025 年 12 月完成论文发布并同步实现完整开源,时间上早于行业内相关成果约两个月。此前,生数科技与清华大学已于 2025 年 7 月提出 Vidar 具身视频模型,围绕“以视频模型作为具身智能统一表征底座”的技术方向展开探索。
研究团队认为,视频天然承载真实世界中的物理时空结构、因果关系与动态变化,是连接感知与行动的重要多模态表征形式。基于这一判断,Motus 试图突破传统具身智能系统中“感知—推理—行动”模块割裂的问题,构建统一的通用世界模型框架。
在模型设计上,Motus 首次在同一框架中统一了 VLA、世界模型、视频生成模型、逆动力学模型以及视频–动作联合生成模型等五类具身基础范式,形成贯通感知、推理与执行的端到端建模路径。与部分侧重仿真渲染的世界模型路线不同,Motus 被定位为可直接用于物理执行的一体化模型。
在数据层面,Motus 针对具身智能长期面临的真机数据稀缺问题,统一了跨本体机器人数据、任务无关数据、仿真数据、人类操作视频以及互联网视频的动作空间,并通过大规模预训练学习通用运动先验,以提升模型的跨任务与跨平台泛化能力。
在评测结果方面,Motus 在多个维度展现出明显优势。在数据规模扩展实验中,Motus 在 50 个任务上的平均成功率相比 Pi0.5 提升 35.1 个百分点,并在相同性能水平下实现 约 13.55 倍的数据效率。在任务数量扩展实验中,随着任务复杂度提升,Motus 的整体成功率保持上升趋势,而对比模型出现明显下降,最终成功率差距约为 37 个百分点。
在 RoboTwin 2.0 仿真环境中,Motus 在覆盖 50 个任务的评测中取得约 88% 的平均成功率。在部分高难度操作任务中,其成功率显著高于现有基线模型。研究团队还在多种真实机器人平台上完成部署测试,结果显示 Motus 在跨任务与跨本体场景中具备较强迁移能力。
生数科技表示,Motus 的开源旨在为具身智能领域提供统一、可扩展的基础模型方案,推动具身智能从模块化系统向统一智能体架构演进。该模型的代码、论文与权重已在 GitHub、Hugging Face 等平台公开。
最新星火攻略
更多- 无限暖暖游说七位自由搭配师任务完成指南
- 可画将品牌设计能力引入 ChatGPT
- 二重螺旋消失的少女任务完成指南
- 逆水寒手游大话骰玩法技巧
- 原神6.0周年庆自选命座选择推荐
- 重返未来1999贝丽尔全面培养指南
- 李想:汽车的终极形态是机器人 全新理想L9让车成为“智能体”
- 心怡云播:NASA火星车AI自主导航测试成功,AI赋能星际探索新征程
- 物华弥新新器者小宋养成指南
- 首个信贷多模态评测基准背后的产业与学术对话:寻找金融领域的ImageNet
- 崩坏星穹铁道大丽花突破材料收集汇总
- 物华弥新天球仪强度详解指南
- 中国航天新突破:太空加油与电推进双剑合璧,卫星寿命迈向30年新纪元
- 松下结构性改革再升级:裁员扩至1.2万,AI项目推倒重来业绩承压
- 理想汽车十年技术沉淀,2026年启新程聚焦具身智能新未来
最新星火智能
更多- 英伟达为3万名工程师部署AI编码工具,代码产出量提升三倍
- 绝区零照逸趣事件触发点位汇总
- 苹果 50 周年庆典定档 4 月,库克承诺将有“大动作”
- 绝区零希望与绝望共生任务触发条件一览
- OpenAI推出GPT-5.3-Codex:速度提升25%,拓展开发全流程支持
- 万兴科技携手生数科技Vidu 共创AI漫剧新生态 开启工业化生产新篇章
- YouTube AI自动配音功能全开放:27种语言随心选,创作者用户双受益
- 燕云十六声新门派梨园入门指南
- 崩坏星穹铁道忘却之庭弦外之声满星通关指南
- 崩坏星穹铁道海瑟音专武抽取指南
- 流放之路2亚马逊开荒技巧指南
- 千问“请客喝奶茶”活动爆火:流量激增致App卡顿,门店临时闭店忙应对
- 千问春节30亿免单活动掀热潮!奶茶店爆单闭店 网友笑称喝啥看骑手“运气”
- 发条总动员新手钻石分配优先级推荐
- 怪物猎人荒野1.021版本太刀配装推荐
最新星火游戏
更多