bob
bob
> 是不是词向量不包含的问题?作者用的词向量是预先用glove的方法训练好的。没有中文就不会生成对应向量吧。 我用word2vec预先训练了词向量可以
说一下我遇到的问题哈, cd data/renMinRiBao/ python data_renmin_word.py 然后 cd tensorflow/ python train.py pretrained 然后报错如下: train len: 24271 test len: 7585 word2id len 3917 Creating the data generator ... Finished creating the data...
> @bobkentt 你看一下你的 语料是不是有问题 是你自己编写的吗 就是把项目直接clone下去啊,没用自己的语料,难到是我TensorFlow版本的问题?你是啥版本的啊?我这俩虚拟机安装的tf环境,版本分别是:1.10.0 1.12.0 都不行
train.py 中改成int64也不行,同时也试了把数据label强转成int32
> In your origin code, the results of SimhashIndex.get_near_dups dont maintain the similar order. If there are several results, which is the most similar? yes,that's what you mean. add a...