open-research
open-research copied to clipboard
[Research idea] 构建知识流动网络及其上的问题定义
Description
同一个仓库、或不同的仓库之间,往往存在各种 Issue、PR 之间的文字引用,这是开发者进行沟通协作过程当中的一种知识流动。和开发者协作网络不同,知识流动网络代表着信息在社区内部和之间的流动价值,为能够精细化的理解开源社区提供了一个视角与思路。下面举例:
在 open-wonderland #135 issue 中,通过引用 oss101-awesome-list 这个仓库,让大家理解该 issue 的上下文,而 GitHub 则会自动出现了一个引用信息,告诉开发者引用关系。

同样,我又会在 oss101-awesome-list 仓库下面的一个 issue 上面,反向写上 open-wonderland #135 issue 的链接,方便开发者进行追踪与后续操作。

通过这种方式,仓库之间的协作知识就完成了连接与流动,各仓库上的开发者看到自己内部的信息是,都可以通过链接的方式,补充更多的信息与知识。这种知识的链接与流动,有利于开放式协作下的效率,应该可以作为一个研究视角。例如,给出如下猜想:
- 一个更加成熟与成功的社区,是否这种知识网络上的协作特征越明显(例如网路密度越高);
- 一个仓库(包括旗下的 issue、PR 等)被其它更多的页面、issue、PR 等提及和引用到,该仓库就具有更高的流行度与品牌认知;
- 马太效应进而出现
- 进而可以设计一个指标,鼓励大家更多的在线上沟通交流的过程中,建立更加丰富的知识网络,这样更加有利于一个项目与这个社区的健康持续发展。
可以进行任务分解:
- 数据集构建
- 数据清洗与分析
- 指标设计
- 指标验证
之前 @birdflyi 做过这个数据集构建,有没有相关资料