learning-nlp icon indicating copy to clipboard operation
learning-nlp copied to clipboard

第七章向量化算法 词袋模型,无法理解

Open rffanlab opened this issue 6 years ago • 0 comments

稳重表述的是“词典中每个单词在文本中出现的频率”但是这个10维向量中应该不会出现0才对应为,另外按照数量来算的话,那么John出现了2次,而likes出现了3次,那么向量不应该是1,2开始的而是2,3开始,不知道我表述的对不对,或者可能我的理解有问题?

rffanlab avatar Jan 06 '19 07:01 rffanlab