比如我说“你好”,asr任务会识别成“你好,我是王丽。”这种情况,会补上一段不存在的语音内容,非常奇怪,不知道是不是通过LLM这种方式进行asr的通病,请教是否有技巧能缓解此类幻觉?比如提高音频质量还是通过提升prompt之类的方式?