你好!感谢你们的工作。我想请问VITA 1.5是否同时支持audio和text的输入? 在`video_audio_demo.py`里面,可以看到`assert (audio_path is None) != (qs == ""), "Exactly one of audio_path or qs must be non-None"`。这是否意味着只能输入一个模态的信息? 谢谢!
你好!感谢你们的工作。我想请问VITA 1.5是否同时支持audio和text的输入?
在
video_audio_demo.py里面,可以看到assert (audio_path is None) != (qs == ""), "Exactly one of audio_path or qs must be non-None"。这是否意味着只能输入一个模态的信息?谢谢!