reality-of-Dream-of-Red-Mansions icon indicating copy to clipboard operation
reality-of-Dream-of-Red-Mansions copied to clipboard

分类前提是否合理?

Open gardenia22 opened this issue 7 years ago • 3 comments

注意到作者是将20-29回合作为一类,110-119作为第二类,所以模型是建立在已知这两类是不同作者所写的前提上。这里是否考虑无监督学习的聚类算法更合理?

gardenia22 avatar Jun 12 '17 07:06 gardenia22

@gardenia22 是的 这里使用无监督学习更为合理,只需要聚类就可以明显得到结论。 这种做法可以当作对假设的一个验证。

Huangtuzhi avatar Jun 12 '17 11:06 Huangtuzhi

@Huangtuzhi 请问有聚类的结果吗?好奇,因为这里把前后分两类也有可能是受剧情发展或者其他因素的影响,感觉不是很有说服力。

gardenia22 avatar Jun 13 '17 06:06 gardenia22

@gardenia22 没有做聚类分析。repo 使用的特征主要是文言虚词和高频动词,这些语言风格的特征受剧情发展的改变很小。

Huangtuzhi avatar Jun 13 '17 11:06 Huangtuzhi