如题 请问这是什么情况。左边是生成的对口型,右边是原视频。我是直接用的原视频然后另外的driving audio <img width="1702" height="914" alt="Image" src="https://github.com/user-attachments/assets/1545cb96-e6d3-46eb-a328-034652b95293" />