请问 STLlama.py 第210行: region_select_out = STE_out[:, :, region_start[0]:region_end[0], :].to(torch.bfloat16) 为什么索引 region_start[0] 和 region_end[0] 呢,一个batch中的所有样本,selected region 都相同吗?
请问 STLlama.py 第210行:
region_select_out = STE_out[:, :, region_start[0]:region_end[0], :].to(torch.bfloat16)
为什么索引 region_start[0] 和 region_end[0] 呢,一个batch中的所有样本,selected region 都相同吗?