MrKamiZhou comments

Results 2 comments of


                                            MrKamiZhou

Poor performance and poor results

I tried this code and https://github.com/hanxiao/bert-as-service to get sentence representation, and tensorflow is much faster, like 200ms vs 2000ms

对英文句子识别好像不太好

> 1、对，这个也是我在思考的解决方案。实际我们识别过程的语料，经常会出现中英文混合的情况，需要增加这种情况，然后还需要增加带空格的语料。字体方面，还需要增加多样性。 > 2、另外我发现因为训练样本数量级太大了，训练实在费时间，我用一块GTX1070显卡，完成一个epoch需要4个小时，不过基本在2～3个迭代之后，ACC提升就非常非常微小，那是否可以只考虑三轮迭代就行了。之前有位兄弟好像用两张显卡，跑了44个epoch，太有毅力了。速度慢可能是因为用了data generator, 我试了试先用numpy 预处理成array再训练会快很多,预处理过程比较耗时, 但是只用做一次