很欣喜贵团队正在开发的对wan2.2文生视频的支持,可否考虑加入对图生视频的支持呢,这样能以初始图片作为初始帧的同时,结合额外的stand in输入的人脸进一步强化一致性。当然我是从用户期待的角度这样表述,不晓得两者是否存在不可逆的冲突。文生视频本质上的原理应该和图生视频一样,只不过是通过提示词生成一张图片作为后续的图生视频的初始帧,所以似乎两者不应存在冲突。