open-research icon indicating copy to clipboard operation
open-research copied to clipboard

[Research idea] Issue 与 PR 中的评论回复关系建立

Open frank-zsy opened this issue 3 years ago • 0 comments

提出这个问题的场景: 在更加细致的协作网络构建中,交互关系不应仅仅是粗略的仓库或 Issue/PR 上的共现关系,而应该可以更加细致到具体每一次活动的关联关系。这些在行为日志中缺失的关联关系对于网络构建和后续任务其实有较大的意义。

例如在一个较长的 Issue/PR 中,一个新增 comment 具体是回复之前的哪条信息,常见的如:

  • 对于当前 Issue 本身内容的一种反馈
  • 对于之前某个具体评论的回复,但可能是 quote reply,则文本中存在相关性。也可能仅仅是直接回复,此时可能需要通过上下文进行分析,看是否存在回复关系。

对于 PR review 则相对确定,因为对于 PR 的 review 是基于某个特定行(或几行)进行的,此时会导致新起一个 thread,那么多次 review comment 如果关联到一个 review id,则他们一定是上下文相关的。

数据: 所以最终该问题可能是一个与 NLP 与连接预测的问题,构建数据可以考虑从全域数据寻找 Issue/PR 评论数较多的一些构建一个数据集,并可能需要人工进行一些回复关系的标注。

frank-zsy avatar May 18 '22 03:05 frank-zsy