reality-of-Dream-of-Red-Mansions
reality-of-Dream-of-Red-Mansions copied to clipboard
分类前提是否合理?
注意到作者是将20-29回合作为一类,110-119作为第二类,所以模型是建立在已知这两类是不同作者所写的前提上。这里是否考虑无监督学习的聚类算法更合理?
@gardenia22 是的 这里使用无监督学习更为合理,只需要聚类就可以明显得到结论。 这种做法可以当作对假设的一个验证。
@Huangtuzhi 请问有聚类的结果吗?好奇,因为这里把前后分两类也有可能是受剧情发展或者其他因素的影响,感觉不是很有说服力。
@gardenia22 没有做聚类分析。repo 使用的特征主要是文言虚词和高频动词,这些语言风格的特征受剧情发展的改变很小。