Chinese-Word-Vectors icon indicating copy to clipboard operation
Chinese-Word-Vectors copied to clipboard

可否公开训练结果的词频文件?

Open feng-1985 opened this issue 6 years ago • 4 comments

可否公开训练结果的词频文件?

feng-1985 avatar Jun 25 '19 01:06 feng-1985

词向量文件中的词是按词频排序的,可以通过Zipf's Law估算一下词频:)

shenshen-hungry avatar Jun 25 '19 07:06 shenshen-hungry

@shenshen-hungry 怎么知道频率最高的词频呢?

feng-1985 avatar Jun 25 '19 13:06 feng-1985

最低词频是知道的。。。

shenshen-hungry avatar Jun 26 '19 13:06 shenshen-hungry

词向量文件中的词是按词频排序的,可以通过Zipf's Law估算一下词频:)

您好,请问基于这种方法估计出来的词频能用于TF-IDF或者SIF的计算吗?

@shenshen-hungry

manipulative avatar Jan 19 '23 20:01 manipulative