难点: 1、控制AI对话使用的token数量 2、如果上述做不到 在相同量级下 只能给相同任务(任务复杂度)进行两个维度指标评价:【token费用,其余LLM模型的评价】 3、需要对温度参数进行控制,保证结论可复现