Rask AI是一款基于人工智能的视频和音频本地化工具,它宣布推出新的多扬声器唇形同步功能。通过人工智能对口型,75万用户可以将他们的内容翻译成130多种语言,听起来像母语人士一样流利。
长期以来,配音内容中的嘴唇动作和声音之间缺乏同步。专家认为,这就是配音在英语国家相对不受欢迎的原因之一。事实上,唇形动作使本地化内容更加真实,因此对观众更有吸引力。
语言学教授Yukari Hirata的一项研究表明,观察嘴唇运动(而不是手势)有助于感知第二语言中困难的音位对比。唇读也是我们学习说话的一种方式。
如今,有了Rask的新功能,本地化内容有可能提升到一个新的水平,使配音视频更加自然。
AI会根据参考自动重组下脸。它考虑到说话人的样子和他们说的话,使最终结果更真实。
它是如何工作的:
上传一段视频,画面中有一个或多个人物。
把视频翻译成另一种语言。
按下“唇同步检查”按钮,算法将评估视频的唇同步兼容性。
如果视频通过检查,按“对口型”并等待结果。
下载视频。
Rask AI的创始人兼首席执行官Maria Chmir表示,这项新功能将帮助内容创作者扩大受众。人工智能在视觉上调整嘴唇运动,使角色看起来像母语人士一样流利。
该技术基于生成式对抗网络(GAN)学习,由生成器和鉴别器组成。生成器和鉴别器相互竞争,以保持领先一步。生成器清楚地生成内容(嘴唇运动),而鉴别器负责质量控制。
测试版适用于所有Rask订阅客户。
作者:Rask AI
链接:https://www.artificialintelligence-news.com/2023/12/07/ai-multi-speaker-lip-sync-has-arrived/
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
声明:海森大数据刊发或者转载此文只是出于传递、分享更多信息之目的,并不意味认同其观点或证实其描述。若有来源标注错误或侵犯了您的合法权益,请作者与本网联系,我们将及时更正、删除,谢谢。电话:15264513609,邮箱:1027830374@qq.com
2023-12-18 12:53:06
Rask AI