能否支持wan2.2的图生视频

很欣喜贵团队正在开发的对wan2.2文生视频的支持，可否考虑加入对图生视频的支持呢，这样能以初始图片作为初始帧的同时，结合额外的stand in输入的人脸进一步强化一致性。当然我是从用户期待的角度这样表述，不晓得两者是否存在不可逆的冲突。文生视频本质上的原理应该和图生视频一样，只不过是通过提示词生成一张图片作为后续的图生视频的初始帧，所以似乎两者不应存在冲突。