2018-CCF-BDCI-China-Unicom-Research-Institute-top2
2018-CCF-BDCI-China-Unicom-Research-Institute-top2 copied to clipboard
关于word2vec的问题
楼主你好,从你的github学到很多东西,谢谢。 我想请问,为什么要对4个月的费用进行word2vec训练? 能解释一下吗?新手
或者说这么做的意义在哪?
抱歉现在才看到你说的这个问题,1.在业务意义上解释的话4个月话费里面有很多数值为整数和带有小数点的金额,当成文本的话有助于识别这两种的区别,但是模型是不能识别这二者的区别;2.形成了类似onehot的效果,如果直接onehot将会直接维度过多;3.这种局部预测上下文对于套餐推送意义工业可移植性强。