text_gcn icon indicating copy to clipboard operation
text_gcn copied to clipboard

预训练效果不好的原因

Open Tansy-Tansy opened this issue 4 years ago • 4 comments

您好,我将您的模型应用在我的数据集上效果非常好。我看到您曾打算用glove预训练初始化特征向量,但是效果不太好,所以改用one-hot初始化,我后来也使用了bert、word2vec预训练初始化效果也不太好。由于对于gcn我才刚入门不久,所以对于这一点我很疑惑,请问您现在知道预训练初始化节点特征效果不好的原因吗?

Tansy-Tansy avatar Apr 13 '20 03:04 Tansy-Tansy

@Tansy-Tansy

您好,可能是因为原始GCN这种full batch的训练方式,每个epoch只更新一次参数,导致用word2vec, glove,bert初始化的参数收敛很慢。

依据是KDD‘19 ’ClusterGCN论文 https://dl.acm.org/doi/10.1145/3292500.3330925 中,第二页,第一段。. Furthermore, although the time per epoch is efficient, the convergence of gradient descent is slow since the parameters are updated only once per epoch。

yao8839836 avatar Apr 19 '20 14:04 yao8839836

BERT https://www.zhihu.com/question/366088445

guotong1988 avatar May 13 '20 06:05 guotong1988

Bert是句子级的,请问您如何对词级的节点做表示?

A11en0 avatar Sep 15 '21 11:09 A11en0

您好,我将您的模型应用在我的数据集上效果非常好。我看到您曾打算用glove预训练初始化特征向量,但是效果不太好,所以改用one-hot初始化,我后来也使用了bert、word2vec预训练初始化效果也不太好。由于对于gcn我才刚入门不久,所以对于这一点我很疑惑,请问您现在知道预训练初始化节点特征效果不好的原因吗?

大佬你好,我想问下您是如何嵌入预训练的词向量,希望能参考下您的代码。

yuyuyu320 avatar May 10 '22 12:05 yuyuyu320