S-LSTM icon indicating copy to clipboard operation
S-LSTM copied to clipboard

分类 输入问题

Open affric opened this issue 4 years ago • 5 comments

s-lstm 应该是对数据集进行分句处理,然后输入模型的吧,我看代码数据集预处理没有对句子进行分割,请作者帮我解惑

affric avatar May 14 '20 05:05 affric

一般输入是不分句的,可以保持顺序信息。如果分句的话,要考虑一些方法来维持句子的关系或者顺序信息,可以参考 (https://www.aclweb.org/anthology/N16-1174.pdf).

leuchine avatar May 14 '20 09:05 leuchine

哦,我看原论文句子状态lstm, 不分句模型怎么分别学习每个句子呀,有点不太理解

------------------ 原始邮件 ------------------ 发件人: "Qi Liu"<[email protected]>; 发送时间: 2020年5月14日(星期四) 下午5:03 收件人: "leuchine/S-LSTM"<[email protected]>; 抄送: "李学伟"<[email protected]>;"Author"<[email protected]>; 主题: Re: [leuchine/S-LSTM] 分类 输入问题 (#4)

一般输入是不分句的,可以保持顺序信息。如果分句的话,要考虑一些方法来维持句子的关系或者顺序信息,可以参考 (https://www.aclweb.org/anthology/N16-1174.pdf).

— You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub, or unsubscribe.

affric avatar May 14 '20 09:05 affric

这里的句子状态是说的输入的sequence,是指整个的输入,不是针对每个句子的。所以一个输入只有一个状态。可能论文说的sentence-state有点误解。

leuchine avatar May 14 '20 11:05 leuchine

这片论文是针对长短句子的。目标不是document长度的。 如果是document 长度。可能需要像你说的那样,每个句子有一个状态。然后句子状态的参数共享。

leuchine avatar May 14 '20 11:05 leuchine

哦,懂了 多谢!

------------------ 原始邮件 ------------------ 发件人: "Qi Liu"<[email protected]>; 发送时间: 2020年5月14日(星期四) 晚上7:14 收件人: "leuchine/S-LSTM"<[email protected]>; 抄送: "李学伟"<[email protected]>;"Author"<[email protected]>; 主题: Re: [leuchine/S-LSTM] 分类 输入问题 (#4)

这里的句子状态是说的输入的sequence,是指整个的输入,不是针对每个句子的。所以一个输入只有一个状态。可能论文说的sentence-state有点误解。

— You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub, or unsubscribe.

affric avatar May 14 '20 11:05 affric