近日,据天眼查知识产权信息显示,阿里巴巴(中国)有限公司在视频生成技术领域取得了突破。该公司申请的“一种图生视频方法和装置”专利已正式公布。这一专利的公布标志着阿里巴巴在智能化视频生成方面迈出了坚实的步伐。
根据专利摘要,该专利的核心在于实现智能化端到端的图生视频。具体而言,该方法通过将包含目标对象的源图像输入到第一视频生成模型中,生成素材视频。随后,根据素材视频确定帧间变换矩阵序列,这一步骤为后续的图像处理和视频生成奠定了关键基础。
在此基础上,专利进一步从源图像中提取出目标对象对应的对象掩码图像。通过将帧间变换矩阵序列应用于对象掩码图像,可以得到多张掩码图像,并组成掩码图像序列。同样地,将帧间变换矩阵序列应用于源图像,可以得到多张目标对象图像,并组成目标对象图像序列。
接下来,根据源图像、掩码图像序列和目标对象图像序列,确定目标输入数据。这一数据随后被输入到支持局部重绘的第二视频生成模型中,最终得到对应的目标视频。这一过程实现了两次模型生成视频,不仅提高了视频生成的智能化水平,还确保了目标对象在运动过程中的不扩散和轨迹多样性。
值得一提的是,该专利无需引入预设运动参数即可实现上述效果。这一创新点使得视频生成更加灵活多变,能够满足更多样化的应用场景需求。
【本图片由科技频道提供】
本文属于原创文章,如若转载,请注明来源:阿里巴巴成功申请一种图生视频方法和装置专利 提升视频生成智能水平https://news.zol.com.cn/946/9466749.html