Hi, 作者您好,在VideoMMMU任务上测试复现onethinker-8B模型结果时测得结果比论文结果略低(64.3 < 66.4)。测试参数使用的是Evaluation/Eval/eval_bench_all.sh里提供的默认参数设置未修改。 <img width="705" height="79" alt="Image" src="https://github.com/user-attachments/assets/c5d94690-a9e7-478d-b6ee-306719323196" />