currenttime
currenttime
Is there any files named test.py? How to use the model for embedding or predict?
Can this project support Chinese? How to modify the code?
我将12层的BERT模型改为6层或者3层,预测有时会出现X的情况,另外预测序列长度小于输入序列长度,请问是怎么回事? 请问如果我想减少BERT的层数,应该在哪些参数上进行调整那?
修改了crf_only = False,再调用terminal_predict.py出错,好像是模型结构匹配不上 WARNING:tensorflow:From /usr/local/lib/python3.6/dist-packages/tensorflow/python/training/saver.py:1276: checkpoint_exists (from tensorflow.python.training.checkpoint_management) is deprecated and will be removed in a future version. Instructions for updating: Use standard file APIs to check for files with...
修改优化器为Lookahead+RAdam 参考https://github.com/Clarence-wen/Ranger-tensorflow里的Ranger实现 将optimizer.py改为optimizer = Ranger(learning_rate=learning_rate) 结果不生效accuracy: 85.49%; precision: 0.00%; recall: 0.00%; FB1: 0.00 另外也尝试过Radam和单纯Lookahead+AdamW也没有效果 请问是什么原因,是只能用AdamW这一中优化器吗?还是有其他地方需要改动?
在log中输出相关信息,我之前会的,重新clone就忘了怎么弄了。
请问 crf_only=False和True效果哪一个好一点? 如果设置crf_only=False时,epoch应该设置为多少比较合适,还有其他参数需要调整吗?
请问关于代码中使用的模型,有没有相关的博客知乎或者理论说明?
memory参数调大调小都不行,预料并不大,done=32512 ,一直报这个错误。
GeForce RTX 2080 8GB batch_size=1,其他参数默认值 out of memory