首页 > 时尚

阿里推出数字人视频生成工具:单张图片生成逼真数字人

来源:中关村在线 时间:2023-08-20 22:16:08


(相关资料图)

阿里云近日推出了一款名为Live Portait的数字人视频生成工具。用户只需上传一张照片和一段文本或语音,就能生成一段能开口说话的数字人视频。这项功能可应用于视频直播、聊天机器人、企业营销等场景,目前已在魔搭社区创空间开放体验。随着对话大模型和AI绘画模型的热度不减,业界对生成式AI的研究逐步朝更多模态的方向演进,其中AI视频生成技术备受关注。这项技术能将文本或音频等信息转换为面部运动信息,进而驱动生成照片人物形象的动画,有效降低了视频拍摄和制作的门槛。Live Portait工具由运动模块和生成模块组成,采用阿里云自研的口型预测算法,使得生成的口型准确度大幅提高。在训练阶段,工具增加了姿态的显式控制,无需底板视频也可以生成任意动作的视频,大幅提升了数字人说话的真实感。此外,通过眼神主动控制技术,Live Portait可以为眼球增加一些自然运动,使得生成结果在观感上更接近真人效果。据了解,Live Portait相关技术已被CVPR、ICCV等国际AI顶会收录。在魔搭社区上,用户在上传照片后,可选择文本驱动和音频驱动两种方式,文本驱动模式下,该工具提供了普通话、英语、粤语、童声等28种声音。此外,Live Portait还提供了轻量模型选择,帮助用户更快速生成视频。阿里云的工具算法负责人张邦表示:“Live Portait集成了团队多项自研创新技术,例如仅需单张图片就能生成逼真的面部动画,突破了传统对抗生成网络的局限。随着技术的进一步迭代,图生视频有巨大的应用空间,有望成为企业降本增效的生产工具。”据悉,该团队研究方向涵盖数字人、3D模型AI生成、高真实感渲染、自然人机交互等领域,目前已发表50多篇国际顶会论文。

相关稿件

阿里推出数字人视频生成工具:单张图片生成逼真数字人

三大航7月份运营数据齐报喜 暑运支撑三季度业绩有望创新高

年轻人跨界报名“夕阳红”旅行团 “蹭老式消费”新观察

广州中医药大学重庆录取分数线 广州中医药大学重庆招生人数多少

《命运方舟》9月6日更新内容介绍

《黑神话:悟空》线下试玩直播开播!大场馆百人共玩

“客户转来几千万,我们崩溃了”…银行基层员工压力调查:“活动太多,大家都说好想生娃”

2021专科专业推荐?

?国资委声明:不法分子冒用国资委和央企领导干部身份实施诈骗 将追究法律责任

2023全国主流媒体德阳行|日加工鲜花、藤椒40吨 德阳广汉这家企业燃“麻”了!

延吉市第六中学新校区正在紧锣密鼓施工

边风炜:市场底前两要素已经具备 复苏将是本轮行情的关键所在

“警”随当“夏” 应城城北派出所全力筑牢辖区防溺水安全屏障

曙光英雄鳗鳗角色攻略 曙光英雄鳗鳗技能解析

谷歌 WearOS 手表系统新特性,支持解锁智能手机

湖北十堰茅箭区:小丝瓜变身“致富瓜”

医保新政“倒逼”药店服务升级——探访江城药市新变化

河北:“绿色通道”畅通灾后重建金融支持

小白浏览器鼠标手势设置方法

制造业仍是日本经济支柱?实地走访看真相

5G套餐高高在上,而固网宽带却打成了白菜价,但运营商仍然赚疯了

毛伊岛大火已致99人死亡 夏威夷州长:失踪人数降至约1300人

希腊男篮公布最终12人名单:字母哥退出+火箭旧将领衔 冲冠没戏

打造“全球治沙样本” 科技治沙技术迭代创新

外交部发言人:中国依然是世界经济增长的重要引擎

浙江金华金东区法学会开展青年普法志愿者法治文化基层行活动

传票送达开庭要多久

2023职业技术学校吃香的专业 什么专业最有发展

聚焦第十四届中国—东北亚博览会布展突出特色 招商集中发力我市有序推进第十四届中国-东北亚博览会参展工作

落花落(关于落花落简述)