YuRonan
YuRonan
韩凡宇 @PureNatural
种子词就在论文的附录吧
韩凡宇 @PureNatural
## 韩凡宇 @PureNatural 1. 开源评论多分类数据集获取,具体参考该[issue](https://github.com/X-lab2017/open-research/issues/199) 2. 数据集的标注工作,人工+工具 3. 完成上述两项工作的同时,尽可能多的完成相应的数据分析工作 4. 寻找开源评论文本的new idea
考虑到距离月底仅剩半个月左右的时间,我觉得我们可以按照王老师给出的整体领域划分先展开一定的文字工作,完成整体论文后尝试投稿,即使没有录用可能也会返回来一部分有价值的评审意见供我们英文文章的完善,毕博给出的图可以将开源平台的具体事件或者现有的数据与王老师概括的各项任务相结合,从而可以一目了然的看出这些任务的可行性,当然毕博的图可能也没有办法将所有的任务涵盖,它相对王老师给出的四大领域更具体了一些 王老师以图数据为例进行了一定的展开,我在想我们的基准测试任务以及工具集与成果展示是不是也以图展开也更好一些。
> 目前的一个需要考虑问题是,上述这些任务,可以怎么样进行以下归类,方便大家:1)简洁直观理解,2)易于分类整理,3)后续方便参与贡献: > > * 按**数据类型**:离散序列数据、时间序列数据、文本数据、图数据 > * 按**问题类型**:分类、聚类、关联、异常等 其实如果从研究者的角度来看如何分类的话,是不是按研究方向分他们会更兴趣一些,因为大部分学生或者老师搜论文也是按自己的研究方向进行检索,例如,复杂网络,推荐系统,社区发现,聚类分析,情感分析等等,不过我觉得按问题类型分也没有问题,按数据分的话,我觉得研究者们可能上来不会首先关心数据类型,他们肯定是先选择研究方向再选数据类型,我觉得只要是他感兴趣的领域或者方向,数据类型可能不是他们最关心的点,不知道大家怎么看?
我在下周三周四左右也会形成一个版本~
中英文摘要我也会先出一版~
链接预测问题应该也算预测问题吧~😊
 https://paperswithcode.com/sota/aspect-based-sentiment-analysis-on-semeval 这个项目里就展示了每一个具体任务下,不同模型跑出来的结果,方便后续科研工作者与其进行对比。 这是自然语言领域下不同任务的模型榜单,基本上很多该方向的研究者都会参考里面的模型。每一个模型都有对应的源码,论文,准确率,F1值等等 我们在未来或许也可以考虑采用这样的方式公开我们实现的一些基准,方便其他人做比较。