2018-CCF-BDCI-China-Unicom-Research-Institute-top2 icon indicating copy to clipboard operation
2018-CCF-BDCI-China-Unicom-Research-Institute-top2 copied to clipboard

关于word2vec的问题

Open cx2214496 opened this issue 6 years ago • 2 comments

楼主你好,从你的github学到很多东西,谢谢。 我想请问,为什么要对4个月的费用进行word2vec训练? 能解释一下吗?新手

cx2214496 avatar Jan 20 '19 03:01 cx2214496

或者说这么做的意义在哪?

cx2214496 avatar Jan 20 '19 07:01 cx2214496

抱歉现在才看到你说的这个问题,1.在业务意义上解释的话4个月话费里面有很多数值为整数和带有小数点的金额,当成文本的话有助于识别这两种的区别,但是模型是不能识别这二者的区别;2.形成了类似onehot的效果,如果直接onehot将会直接维度过多;3.这种局部预测上下文对于套餐推送意义工业可移植性强。

PandasCute avatar Mar 22 '19 08:03 PandasCute