DSRAN icon indicating copy to clipboard operation
DSRAN copied to clipboard

vocab.py bulid_vocab(....,threshold=300)?

Open KevinLight831 opened this issue 3 years ago • 2 comments

https://github.com/kywen1119/DSRAN/blob/630d9dc19fe47c5bd32d3b21bd934aead4b1b87b/vocab.py#L121 为什么这里是300,之前的大多设为4,occurrence高于300的词很少吧

KevinLight831 avatar Apr 01 '21 07:04 KevinLight831

是不是因为vocab.py只用vocabulary对象初始化读取的文件,build_vocab函数没用,也就是说vocab.py只有vocabulary类有用到

KevinLight831 avatar Apr 01 '21 08:04 KevinLight831

这个我没有用到,直接使用的VSE++的vocab文件

kywen1119 avatar Apr 01 '21 08:04 kywen1119