您好,感谢您开源了如此出色的工作;但我在测试时遇到一些问题,1.训练的数据是否包含中文说话; 2.我测试时,部分时间会出现人物嘴部张和过大的情况;3.您论文中Table1的比较数据是基于什么数据集的呢?是否有在LRS2或HDTF上和更多的工作进行过比较(比如wav2lip)