Xiaoyue Xiao comments

Results 18 comments of


Xiaoyue Xiao

HAN中的Document编码形式似乎不妥？

您好，您的顾虑是正确的。这份实例代码仅仅为了展示 HAN 能够正常运行。在实际使用的时候，确实应该按照句子维度进行 padding的。

TypeError: add_weight() got multiple values for argument 'name'

这可能是 Keras 升级了 API 导致的，你可以查一下最新的 API，相应的修改一下参数即可

请问大神：在TextAttBiRNN中怎么输出Encoder中某个词对最后预测的权重值啊？

您可以 google 一下“attention 可视化”

HAN报错

您可以阅读论文，了解一下 HAN 的原理，输入的维度应该是 `(samples, #sentence, #word)`

> 1. 为什么tfidf，doc2vec你都做了stacking，而word2vec没有呢？ TFIDF 和 Doc2Vec 都做了 Stacking，是因为这两个特征的维度太高了，不好直接输送给 XGBoost 模型。此项目中的 Word2Vec 向量维度输送给 XGBoost 模型还能够接受，另外效果上也还可以，所以没有做 Stacking。 > 2. 如果加入lda的特征需要进行stacking吗？ LDA 特征输送给 XGBoost 的话，训练速度能够接受的话，可以不做 Stacking。如果基本无法训练，或者效果上不好，还是做一层 Stacking 比较好。

关于交叉验证

> 设置交叉验证的目的是什么？设置交叉验证的目的是为了寻找最优轮数。 > 能否不设置，直接训练预测？当然可以。

word2vec 训练

是的

想求一下生成mybatis的方式

您好，我的 mapper xml 不是生成的，是自己手打的。起初我也使用过 MyBatis xml 的生成器之类的工具，但是后来发现这些自动生成的不是特别适配我的需求，于是我便开始手打。如果您也不太满意工具生成，您可以基于工具生成的 xml 进行适当的修改，或者自己手打。祝好， Shawn Xiao

您好，请问下sigmoid是怎么做多分类的？

1 vs rest。举个例子，假设有 3 个分类，那就可以做 3 个 Sigmoid 模型，分别预测：是否是分类 1、是否是分类 2 和是否是分类 3。

开源代码才是真的开源

道德绑架？