NLP_related_projects
NLP_related_projects copied to clipboard
Mark and summarize the NLP project has been through
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd5 in position 144: invalid continuation byte
请问这个如何解决 Traceback (most recent call last): File "D:/down/NLP_related_projects-master/BERT/Bert_sim/run_similarity.py", line 716, in sim = BertSim() File "D:/down/NLP_related_projects-master/BERT/Bert_sim/run_similarity.py", line 141, in __init__ self.tokenizer = tokenization.FullTokenizer(vocab_file=cf.vocab_file, do_lower_case=True) File "D:\down\NLP_related_projects-master\BERT\Bert_sim\bert_model\tokenization.py", line 165, in __init__...
一般计算文本相似度会用到余弦距离或者欧氏距离等,那么在这个项目中用到的是什么方法或者原理呢?
![Uploading image.png…]() 这里面的bert_model指的是什么呢
dataset
请问RGCN链路预测这个数据集是什么呀?可以发出来嘛
为什么我用自己预训练得到的模型来做英文的文本相似性分析时,不管怎么改变两个用来预测的句子,最后的结果都很接近0.5。而且最后两个句子预测得到的label好像不是计算得到的,就是一开始设置的那个label啊?
bert模型文件好像没有 from bert_dir.bert.bert import modeling from bert_dir.bert.bert import tokenization from bert_dir.bert.bert import optimization bert_dir不存在
在load_vocab时出现编码错误
作者能分享下RGCN的输入数据吗,想用你的数据尝试跑下程序