启动train_from_scartch.py后,第一个epoch还没有训练完,loss就从61直接变为nan。 我没有调整任何超参,是learning rate = 0.001太高了的原因吗?
启动train_from_scartch.py后,第一个epoch还没有训练完,loss就从61直接变为nan。
我没有调整任何超参,是learning rate = 0.001太高了的原因吗?