Yao Tinghao
Yao Tinghao
训练代码为 ``` InputArgs inputArgs = new InputArgs(); inputArgs.setLoss(LossName.ns); inputArgs.setThread(15); inputArgs.setEpoch(100); inputArgs.setLr(0.5); inputArgs.setDim(100); FastText model = FastText.trainSupervised(trainFile, inputArgs); ```
> 我想做模糊文本到唯一id的映射,即使缺字多字依旧能尽可能匹配,为此专门做了汉字编码,希望对于相似字也能实现匹配 以下是train的一行参照 ``` __label__00004e937c254cef906f24ae819ed540 78542508029 AE010320006 GG032906029 FC42168327G 4D012106046 F7022402279 AE010320006 F0012304046 K702C430145 FD442777327 FJ542102273 G401127754A 5A02137120C GE04184781F F803134117C FJ51130127C 3G041342107 6C018717144 E0042101002 5E031271128 7 2 9A042600275 ```
> 你这个应该去用词向量或者simhash之类的方案,不应该用文本分类 感谢建议,我尝试更换下方法