苏剑林(Jianlin Su)
苏剑林(Jianlin Su)
> 请问能否用更高的的tf版本诸如2tf.x去跑呀,目前3090的需要cuda11,但是tf1.x的只能到cuda10,不知道您是如何配置的? 不知道tf2能不能跑,但是“珍惜生命,远离tf2”是真心的建议。3090可以用nvidia-tensorflow 1.15
写到一个sh脚本中,这是linux的shell脚本
短文本直接跑个unilm的seq2seq模型不更好吗?
装不上tf 1.14+那就用不了,bert4keras需要tf 1.14+(虽然我不知道你前面是怎么训练成功的)
我是24G的卡,batch_size就是开源代码里边写的batch_size,直接开源出来的,没有改变啥。 多gpu参考:https://github.com/bojone/bert4keras/blob/master/examples/task_seq2seq_autotitle_multigpu.py
这很明显就是没找到权重文件的意思啊,你是不是没训练完抽取模型?看一下weights目录有没有该文件不就行了?
你说 `ls weights/extract_model.1.weights` 是存在的?我不大相信~你进到当前目录下跑了没?
> 然后 训练生成的是“extract_model.0.weights” 报错说找不到“extract_model.1.weights” 当我把文件改为“extract_model.1.weights”时, 就报错找不到“extract_model.0.weights”, 很迷惑 | | rmx099128 | | [email protected] | 签名由网易邮箱大师定制 On 1/20/2021 11:40,rmx099128 wrote: 😂, 我这个训练完成了, 这里面又这个文件, 但是它自己就是找不到 不知道什么问题 😓 | | rmx099128 | |...
> 哦 那我知道了, 我里面只有一个权重文件, 因为我循环执行的时候 应该是文件名被覆盖了 所以只有一个 我在看看, 太感谢您, 打扰您了, 谢谢~~ | | rmx099128 | | [email protected] | 签名由网易邮箱大师定制 On 1/20/2021 11:43,苏剑林(Jianlin Su) wrote: 然后 训练生成的是“extract_model.0.weights” 报错说找不到“extract_model.1.weights” 当我把文件改为“extract_model.1.weights”时, 就报错找不到“extract_model.0.weights”, 很迷惑...
我是公司的服务器,256G内存(捂脸)