Xiaoyue Xiao

Results 18 comments of Xiaoyue Xiao

您好, 您的顾虑是正确的。这份实例代码仅仅为了展示 HAN 能够正常运行。在实际使用的时候,确实应该按照句子维度进行 padding的。

这可能是 Keras 升级了 API 导致的,你可以查一下最新的 API,相应的修改一下参数即可

您可以阅读论文,了解一下 HAN 的原理,输入的维度应该是 `(samples, #sentence, #word)`

> 1. 为什么tfidf,doc2vec你都做了stacking,而word2vec没有呢? TFIDF 和 Doc2Vec 都做了 Stacking,是因为这两个特征的维度太高了,不好直接输送给 XGBoost 模型。此项目中的 Word2Vec 向量维度输送给 XGBoost 模型还能够接受,另外效果上也还可以,所以没有做 Stacking。 > 2. 如果加入lda的特征需要进行stacking吗? LDA 特征输送给 XGBoost 的话,训练速度能够接受的话,可以不做 Stacking。如果基本无法训练,或者效果上不好,还是做一层 Stacking 比较好。

> 设置交叉验证的目的是什么? 设置交叉验证的目的是为了寻找最优轮数。 > 能否不设置,直接训练预测? 当然可以。

您好, 我的 mapper xml 不是生成的,是自己手打的。起初我也使用过 MyBatis xml 的生成器之类的工具,但是后来发现这些自动生成的不是特别适配我的需求,于是我便开始手打。如果您也不太满意工具生成,您可以基于工具生成的 xml 进行适当的修改,或者自己手打。 祝好, Shawn Xiao

1 vs rest。举个例子,假设有 3 个分类,那就可以做 3 个 Sigmoid 模型,分别预测:是否是分类 1、是否是分类 2 和是否是分类 3。