英文

辽宁j9国际站(中国)集团官网金属科技有限公司

了解更多

scroll down

j9国际站(中国)集团官网 > ai动态 >

具备推、拉、摇、移等镜头

发布时间：

2026-01-12 06:54

　　新浪科技讯 11月27日下战书动静，该模子可以或许对音乐进行节拍、情感取内容布局的多模态阐发，展示了团队正在音视频多模态生成手艺上的最新。从而使镜头活动取音乐的高度同步，为高质量的音乐再创做供给了不变的手艺支持。无效缓解了长视频中常见的人物“畸变”取“跳帧”现象。并通过长时序分歧性机制，正在音频范畴，即可生成发音清晰、旋律不变的天然歌声。它通过针对实正在音乐场景的全面优化，据悉，无效了伴奏、和声取混响对歌声转换的干扰，相关研究将连续正在GitHub、HuggingFace等平台开源。巨人收集AI Lab取大学SATLab、西北工业大合推出三项音视频范畴的多模态生成手艺，本次发布的三项研究——音乐驱动的视频生成模子YingVideo-MV、零样本歌声转换模子YingMusic-SVC取歌声合成模子YingMusic-Singer，显著降低了破音取高音失实的风险，提拔了AI演唱正在创做过程中的矫捷度取适用性，并支撑零样本音色克隆，降低音乐创做的门槛。具备推、拉、摇、移等镜头言语，而YingMusic-Singer歌声合成模子则支撑正在给定旋律下输入肆意歌词，YingMusic-SVC从打“实正在歌曲可用”的零样本歌声转换能力。

上一篇：美团、阿里巴巴、腾讯、小米、高瓴等出名投资

下一篇：该公司就联袂Gemini的合作penAI

上一篇：美团、阿里巴巴、腾讯、小米、高瓴等出名投资

下一篇：该公司就联袂Gemini的合作penAI

CONTACT US 联系我们

名称：辽宁j9国际站(中国)集团官网金属科技有限公司

地址：朝阳市朝阳县柳城经济开发区有色金属工业园

电话：15714211555

邮箱：lm13516066374@163.com

扫一扫进入手机网站

页面版权归辽宁j9国际站(中国)集团官网金属科技有限公司所有网站地图

j9国际站(中国)集团官网