文章详情

Meta 与滑铁卢大学的研究团队共同开发了一款名为 MoCha 的人工智能系统,能够生成包含同步语音和自然动作的完整角色
2025-04-27 23:32:05
文章详情介绍
Meta 与滑铁卢大学的研究团队共同开发了一款名为 MoCha 的人工智能系统,能够生成包含同步语音和自然动作的完整角色动画。这一创新突破不同于以往仅聚焦于面部的动画生成模型,MoCha 可从多个摄像机角度渲染全身动作,涵盖嘴唇同步、手势表现,以及多个角色之间的互动。
提高口型同步准确度
MoCha 的演示重点展示了特写镜头和半特写镜头下的上身动作与手势同步生成。该系统的独特之处在于其引入的“语音-视频窗口注意”机制,这一机制成功解决了长期以来困扰 AI 视频生成的两个主要挑战:一是视频压缩时如何保持音频的全分辨率,二是在并行生成视频时避免唇部运动与音频不匹配的问题。
MoCha 的创新之处在于,通过限制每帧访问特定音频数据窗口,模拟了人类的发音方式——嘴唇运动与即时声音密切相关,而肢体语言则依据更广泛的文本模式展现。通过在每帧音频前后添加标记,MoCha 能有效实现更平滑的过渡和更精准的嘴唇同步。
MoCha 根据文本描述生成带有面部、手势和嘴唇动作的逼真视频。
为了构建该系统,研究团队使用了300小时精心筛选的视频内容,并结合基于文本的视频序列来扩展表现和互动的可能性。尤其是在多角色场景下,MoCha 展现了其强大的能力,用户只需简单地定义角色一次,便可通过标签(如“人物1”或“人物2”)在不同场景中轻松调用,无需重复描述。
管理多个角色
在150种不同场景的测试中,MoCha 在口型同步与自然动作的质量上,均超过了同类系统。独立评估人员一致认为该系统生成的视频高度逼真,表现出了前所未有的精度与自然度。
研究人员开发了一个提示模板,让用户无需重复描述即可引用特定字符。
MoCha 的开发使其在多个应用领域展现出巨大潜力,尤其在数字助理、虚拟化身、广告与教育内容等领域。尽管 Meta 尚未透露该系统是否会开源,或仍处于研究原型阶段,但这一技术的推出无疑为 AI 驱动的视频生成开辟了新的篇章。
在人工智能视频技术竞争日益激烈的背景下,MoCha 的发布尤为引人注目。Meta 最近也推出了 MovieGen 系统,而 TikTok 母公司字节跳动则在研发自己的人工智能动画工具,包括 INFP、OmniHuman-1和 Goku,显示出社交媒体公司在这一领域的积极布局。
最新星火攻略
更多- 英国智库建议放宽人工智能相关版权法规,以促进跨大西洋合作和关系维护
- ChatGPT 借助 “吉卜力热潮” 快速增长,付费用户数量突破 2000 万大关
- Meta AI 研究负责人皮诺宣布离职 650亿美元投资计划仍在持续推进中
- 魔兽世界考古虫子的秘密揭示:深入挖掘考古虫子背后的传奇故事与神秘力量
- OpenAI 延迟推出新产品,图像生成技术遇到容量瓶颈挑战
- OpenAI 低调推出 OpenAI 学院,免费提供丰富的人工智能学习资源,助力教育发展
- 梦幻西游跑商工具箱:每位玩家都不可或缺的游戏辅助神器与必备工具
- 在人工智能浪潮中,软件供应链遭遇严重安全威胁:机密泄露事件增加了64%
- 日本 Rapidus 正式启动 AI 芯片的试生产工作,迈出关键一步
- 炉石传说英雄乱斗深入研究与解析,探讨其策略与玩法的全面指南
- 微软首席技术官指出产品经理在人工智能培训过程中扮演着关键角色的重要性
- 魔兽争霸:三国无双的巅峰之作——经典策略与动作的完美结合之旅
- 广东省推出新策略,全面促进人工智能和机器人产业的“AI+”与“机器人+”应用创新发展
- 造梦西游3修改大师豪华版使用指南 - 如何高效利用造梦西游3修改大师豪华版进行游戏修改
- 国家天文台与阿里云联合推出全球首款太阳大模型“金乌”:M5级耀斑预报准确率成功突破91%水平
最新星火智能
更多- LOL天赋系统的各种BUG分析与解决方案深度探讨
- HCLTech 在美国设立全新 AI 驱动的公共部门子公司,推动智能化服务发展
- 宇树科技推出Dex5灵巧手:实现单手20个自由度,挑战人类在精细操作领域的极限能力
- GPT-4o的图像生成技术不断突破,展现多领域卓越才能,激发AI创意的新极限
- AI日报:Runway推出新一代视频生成模型Gen-4;宇树G1在短短5分钟内直播带货突破百万销售额;OpenAI宣布即将开源新型AI模型
- 部落守卫战21-5关卡详细攻略与战术深入分析,助你轻松通关挑战
- 联想推出三大全新AI服务品牌“擎天、百应、想帮帮”,积极进军AI服务市场抢占先机
- 途牛推出全新智能助手“小牛”:依托开源大模型,畅享一站式智能出行服务新体验
- 纸嫁衣4第三章:在迷雾重重的情节中揭开真相的秘密与探索
- 顺丰同城与豆包、腾讯混元等多家企业成功建立战略合作关系,以推动本地服务的发展
- 天下3魍魉角色加点解析与技巧分享,助你轻松掌握魍魉加点攻略
- 2024年广东省人工智能核心产业预计规模将突破2200亿元大关
- 伟大的妈妈35节阅读答案:在游戏中学习与成长的乐趣与启示(游戏教育的重要性与亲子互动)
- Krea全新上线3D生成功能,并全面优化网站界面,可能借助混元技术提升用户体验
- 国家天文台依托通义千问成功构建全球首个太阳大模型“金乌”,推动天文科学的发展