腾讯AI实验室近日推出了渐进式条件扩散模型(PCDMs),这一突破性技术在姿态引导人物图像合成方面取得了显著进展。PCDMs由先验条件扩散模型、修复条件扩散模型和完善的条件扩散模型三个关键阶段组成,成功应对了源图像与目标图像的姿态不一致问题,并解决了生成高质量、逼真图像的挑战。
经过实验证明,在DeepFashion和Market1501数据集上的各项指标上,PCDMs明显优于其他SOTA方法。特别是在小尺度数据集Market1501(128*64)上的SSIM指标达到最高值0.3169,比第二名PIDM高出3.8%。
值得注意的是,在先验条件扩散模型第一阶段中,给定源图像和姿势坐标为条件时,通过一个变换网络来预测目标姿势下的全局特征。同时,在修复条件下进行完善,建立源图与目标图之间的紧密联系至关重要,并确保跨多个维度(如图像、姿势和特征)进行对齐。
最后,在完善条件下进行细化操作以提高图像质量和纹理细节。这一阶段利用先前生成的粗粒度图像作为条件,进一步提高图像保真度并确保纹理一致性。此外,还引入了交叉注意力机制来注入网络以辅助纹理修复和细节增强。
论文地址:https://arxiv.org/pdf/2310.06313.pdf
GitHub地址:https://github.com/muzishen/PCDMs
本文属于原创文章,如若转载,请注明来源:腾讯AI实验室新突破!推出渐进式条件扩散模型https://news.zol.com.cn/840/8402788.html