MrKamiZhou

Results 2 comments of MrKamiZhou

I tried this code and https://github.com/hanxiao/bert-as-service to get sentence representation, and tensorflow is much faster, like 200ms vs 2000ms

> 1、对,这个也是我在思考的解决方案。实际我们识别过程的语料,经常会出现中英文混合的情况,需要增加这种情况,然后还需要增加带空格的语料。字体方面,还需要增加多样性。 > 2、另外我发现因为训练样本数量级太大了,训练实在费时间,我用一块GTX1070显卡,完成一个epoch需要4个小时,不过基本在2~3个迭代之后,ACC提升就非常非常微小,那是否可以只考虑三轮迭代就行了。之前有位兄弟好像用两张显卡,跑了44个epoch,太有毅力了。 速度慢可能是因为用了data generator, 我试了试先用numpy 预处理成array再训练会快很多,预处理过程比较耗时, 但是只用做一次