DSRAN
DSRAN copied to clipboard
vocab.py bulid_vocab(....,threshold=300)?
https://github.com/kywen1119/DSRAN/blob/630d9dc19fe47c5bd32d3b21bd934aead4b1b87b/vocab.py#L121 为什么这里是300,之前的大多设为4,occurrence高于300的词很少吧
是不是因为vocab.py只用vocabulary对象初始化读取的文件,build_vocab函数没用,也就是说vocab.py只有vocabulary类有用到
这个我没有用到,直接使用的VSE++的vocab文件