currenttime

Results 12 issues of currenttime

Is there any files named test.py? How to use the model for embedding or predict?

Can this project support Chinese? How to modify the code?

我将12层的BERT模型改为6层或者3层,预测有时会出现X的情况,另外预测序列长度小于输入序列长度,请问是怎么回事? 请问如果我想减少BERT的层数,应该在哪些参数上进行调整那?

修改了crf_only = False,再调用terminal_predict.py出错,好像是模型结构匹配不上 WARNING:tensorflow:From /usr/local/lib/python3.6/dist-packages/tensorflow/python/training/saver.py:1276: checkpoint_exists (from tensorflow.python.training.checkpoint_management) is deprecated and will be removed in a future version. Instructions for updating: Use standard file APIs to check for files with...

修改优化器为Lookahead+RAdam 参考https://github.com/Clarence-wen/Ranger-tensorflow里的Ranger实现 将optimizer.py改为optimizer = Ranger(learning_rate=learning_rate) 结果不生效accuracy: 85.49%; precision: 0.00%; recall: 0.00%; FB1: 0.00 另外也尝试过Radam和单纯Lookahead+AdamW也没有效果 请问是什么原因,是只能用AdamW这一中优化器吗?还是有其他地方需要改动?

在log中输出相关信息,我之前会的,重新clone就忘了怎么弄了。

请问 crf_only=False和True效果哪一个好一点? 如果设置crf_only=False时,epoch应该设置为多少比较合适,还有其他参数需要调整吗?

请问关于代码中使用的模型,有没有相关的博客知乎或者理论说明?

memory参数调大调小都不行,预料并不大,done=32512 ,一直报这个错误。

GeForce RTX 2080 8GB batch_size=1,其他参数默认值 out of memory