lasertagger-chinese icon indicating copy to clipboard operation
lasertagger-chinese copied to clipboard

需要先对文本进行tokenize吗

Open drxmy opened this issue 3 years ago • 0 comments

您好,我想请教一下,我看官方开源的里面写着说数据要先tokenize,这个单指分词呢?还是分词后要进一步转化为数字?因为我看这个issue里面https://github.com/google-research/lasertagger/issues/11 ,还提到了detokenize。

drxmy avatar Jun 16 '21 11:06 drxmy