用vllm推理的qwen2-7B的环境,模型换成了apollo-6B起来服务以后调用成功,但是返回内容大概率是空白,小概率是乱码类的内容。 