苏剑林(Jianlin Su)
苏剑林(Jianlin Su)
感觉像是机器资源不够导致的退出(内存不够,cpu不够之类的,我也不确定)
那就不清楚了。 看开头`Could not load dynamic library 'cudart64_100.dll'`,是不是没有gpu环境而装了gpu版tf?换用cpu版tf试试~
麻烦按照提问模版提供详细的信息。
哦,对了,不知道你莫名其妙地加个`,_`干嘛,`bert_encoder`返回的是一个tensor,你强行映射为两个,这是你的这个错误的原因。
一样。不过你用simcse的代码的话,估计会少了mlm部分权重(因为simcse没有mlm)
看错误信息,似乎跟模型实现没有关系?
check your ~/.keras/keras.json. the image_data_format must be channels_last
@FlyDogFan "loss not change" seems like capsule's problem, not my implement~ you can try to replace K.epsilon() with 1e-3 in squash function in Capsule_Keras.py to solve nan problem.
为什么要与原文相符?我这样就不合理了吗?