wujixian
Results
2
issues of
wujixian
tensorflow版本的tran.py文件在加载预训练向量的时候,原始的是word2id找到的是id,而不是字,word2vec里的词向量都是以字为主的,所以word2id应该改成id2word. 如果不改的话 也是能用的,不过embedding_pre全部是111111111,而不是vec.txt里的字向量。建议楼主改下这个坑,很难发现的。
def get_entity(x,y,id2tag): entity="" res=[] for i in range(len(x)): #for every sen for j in range(len(x[0])): #for every word ... ... 这两个for循环中第一个是没问题的,因为统一batchsize大小了,但第二个for循环就有问题了, 因为x[0]的大小可能会大于60 这里没有做cut操作,因此j会大于60 导致y[i][j]数组越界,希望楼主可以更改一下。加上一个判断 for i in range(len(x)): #for every...