能否提供一个简单易用的推理代码。 当前高度耦合的代码, 测试很多实际结果存在很多问题,不方便排查问题原因。 比如提供一个例子, 输入prompt + , 输出layout可控的结果,而不仅仅是从dataset读入数据。 具体来说,我们跑LayoutSAM 看起来指标和定性结果是正常的,但是我们实际测试具体例子的时候,结果非常差。这很反常,尤其是layout区域内结果比较差。 还有想请问下:neg prompt 和 neg bbox prompt 这些有什么明确的作用么?