Results 4 comments of burette

> 大佬,negative300.bin这个文件试过吗 这个文件试过了。用的就是GoogleNews-vectors-negative300.bin这个预训练的。原代码使用Python2.7,我使用的python3.5,按照原来代码读这个文件的地方,会出现错误,内存溢出。python3下使用下面的片段进行读取negative300.bin: for line in tqdm(range(vocab_size)): # word = [] # while True: # ch = f.read(1) # if ch == b' ': # # word = ''.join(word) #...

> 你这种方法读取太慢了,要3个小时 读取三个小时可能是机器性能问题?我这边几台机子都是几分钟读完i5的机子

> 大佬有试过gensim读取bin文件吗 from gensim.models.keyedvectors import KeyedVectors model = KeyedVectors.load_word2vec_format( 'GoogleNews-vectors-negative300.bin', binary=True, limit=300000)

> 大佬,您好 > 我想问一下,你当时训练时候机器的内存是多少呢。我目前训练这个机器的内存是22g,然后虚拟内存是55g,最后还是内存爆满。 应该是读取google.bin这里出了问题。不然你的内存应该是够用的。