大神您好。 阅读你关于capsule的三篇文章收益良多。 参考你的代码,换了一个数据集,迭代次数比你例子多,也会出现loss为nan的情况。按你的提升替换了squash中的K.epsilon()为0.001,并没有解决这个问题。 请问是什么地方会导致这个计算结果呢?