https://github.com/Joluck/RWKV-PEFT/blob/5704c39f8ab1d2ac63936ab392aadb6ba526e1a5/rwkvt/rwkv7/model.py 非常实用的工作,目前实际使用时想咨询下,代码已经支持attention mask防止pad 的影响了嘛? 另外推理的时候如何调用,谢谢了~