open-research icon indicating copy to clipboard operation
open-research copied to clipboard

📚 用开源的方法来研究开源的现象。(open source methodology for open source phenomena)

Results 142 open-research issues
Sort by recently updated
recently updated
newest added

### Description 根据实验室近期整理的[两篇技术报告](https://github.com/X-lab2017/open-research/issues/166#issuecomment-1661748775),先参考如下框架推动 2022 级硕士研究生的科研法方向的选择,前期也和各位同学做了相关的沟通,欢迎大家积极讨论~ --- - @wj23027 - 任务名称:待定 - 应用场景:开源教育实践/开源社区运营 --> 开发者人才画像 - 任务类型:待定 - 数据集:图数据类型 - 模型:网络/图模型 - @andyhuang18 - 任务名称:待定 - 应用场景:开源教育实践/开源社区运营 --> 开发者技能评估 - 任务类型:待定...

### Description 在异质网络中,每个节点的重要性都不一样,排序就是把节点按重要性高低排成一列,可以帮助我们识别出“最重要”的节点。在不同粗粒化的视角里,节点的重要性排序也不尽相同。人们在不同的研究问题中使用着不同的排序方法。 传统的网络分析局限于只有两两交互的节点的复杂网络表示。然而,在大量研究中,网络中的相互作用并不局限于节点对,常常涉及到节点的高阶团(clique)。研究团之间的高阶互动,我们需要新指标、新工具。对团进行排序有助于理解具有高阶结构的大规模复杂网络中更多的涌现动力学现象,比如同步、动力学演化和流行病传播等重要问题。 这篇文章总结了常见的几种传统节点排序方法,然后还基于拓扑单纯形提出了几种高阶中心性:高阶圈比(HOC)、高阶度(HOD)、高阶H指数(HOH)和高阶 PageRank(HOP),对团的重要性进行量化和排序,并展示了在生成网络和真实网络中的实验结果。这些结果都表明,与其他传统网络指标相比,这些高阶中心性可以将团排列得更有“区别”,能有效降低大规模网络的维数,更准确地找到重要团。更重要的是,根据所提出的度量对团进行排序,能够准确反映网络在结构鲁棒性、行为同步和动态传播等方面的功能影响。 这些内容,对优化与扩展 OpenRank 模型有着积极的帮助~ - 参考文章:https://mp.weixin.qq.com/s/HV8POufp3VGN_EN0s2sWgQ - 论文地址:https://pubs.aip.org/aip/cha/article/33/7/073139/2903051/Ranking-cliques-in-higher-order-complex-networks

### Description 复杂网络中的研究成果一直是图数据科学中各种指标、算法、以及实际应用的灵感来源。 《Characterizing Cycle Structure in Complex Networks》一文基于对圈结构的统计特征分析,提出了一个新的矩阵,圈数矩阵(cyclenumber matrix),用于表征网络中的圈信息,并基于此,提出了一个新的节点重要性排序指标,**圈比**(cycle ratio)。通过与现有指标进行对比,作者发现圈比所识别出的重要节点与原有的多个重要节点排序指标的结果非常不同,而原有的多个指标的结果却是非常相似的。进一步的实验表明,使用圈比所识别出的重要节点对网络进行恶意攻击,会使得网络更快地崩溃;或者通过牵制控制这些节点,可以使网络更快地达到同步状态;而在传播能力方面——无论在快速传播还是完全传播中,这些节点也具有最大的传播能力。这些结果表明,对圈结构的深入研究,很可能为网络科学提供新的洞见、指标、模型和算法,并对提升网络抗攻击能力、优化控制系统设计、增强新冠病毒防控效力、以及最大化网络营销等带来新的启发。 - 参考链接:https://mp.weixin.qq.com/s/kfqPSK8uj3ZSD9rzmxyowg - 论文链接:https://www.nature.com/articles/s42005-021-00781-3

### Description ![github项目QA](https://github.com/X-lab2017/open-research/assets/15813364/477a056d-432f-4581-8741-5ba88fc5bf1b) 可以看看更新后的架构是否有问题 @TieWay59 这个项目需要不少工程实践 然后其中可以发觉的研究点有: - 问题QA提取 - Docs文本精准分割 - 包含上下文信息的提示词+问题匹配 - 向量检索 - 大模型微调效果验证

### Description 同一个仓库、或不同的仓库之间,往往存在各种 Issue、PR 之间的文字引用,这是开发者进行沟通协作过程当中的一种知识流动。和开发者协作网络不同,知识流动网络代表着信息在社区内部和之间的流动价值,为能够精细化的理解开源社区提供了一个视角与思路。下面举例: 在 [open-wonderland #135](https://github.com/X-lab2017/open-wonderland/issues/135 ) issue 中,通过引用 [oss101-awesome-list](https://github.com/X-lab2017/oss101-awesome-list) 这个仓库,让大家理解该 issue 的上下文,而 GitHub 则会自动出现了一个引用信息,告诉开发者引用关系。 ![image](https://user-images.githubusercontent.com/15010826/180911347-5fbf793a-b918-479d-9ecd-5d6de5205bd5.png) 同样,我又会在 oss101-awesome-list 仓库下面的[一个 issue](https://github.com/X-lab2017/oss101-awesome-list/issues/1) 上面,反向写上 [open-wonderland #135](https://github.com/X-lab2017/open-wonderland/issues/135) issue 的链接,方便开发者进行追踪与后续操作。 ![image](https://user-images.githubusercontent.com/15010826/180912445-70b27f00-f72b-4d6c-bf28-e78b66617c49.png) 通过这种方式,仓库之间的协作知识就完成了连接与流动,各仓库上的开发者看到自己内部的信息是,都可以通过链接的方式,补充更多的信息与知识。这种知识的链接与流动,有利于开放式协作下的效率,应该可以作为一个研究视角。例如,给出如下猜想: -...

开题框架 ![image](https://github.com/X-lab2017/open-research/assets/37795442/b7a3b034-338d-466c-b798-43c7c3ddf3db)

### Description 本 issue 用于跟踪 @zhicheng-ning 的毕业论文的开题进度~ 初步 keyword: - 推荐 - 网络 - 开发者 - 项目 - 画像

学位论文: 开题

### Description Description 开题报告初版~:https://xlab2017.yuque.com/zaritf/dozuim/aolurdco9e7uifch

### Description 开题报告初版~:https://xlab2017.yuque.com/xvdwry/tlv0g7/eom0vhevxicvc1p0

### Description 我目前准备研究GitHub上社交网络的构建。但是在探索的过程中有个疑问:社交网络和协作网络的区别是什么呢? 在GitHub中的能表示社交行为的我觉得有两种: 一种是follow following关系,另一个种是王老师提到的issue、pr中的@关系。 但是因为GitHub的社交都是发生在协作的过程中的,所以issue、pr在协作网络和社交网络中是有很多重叠的。这种情况应该怎么处理呢?或者说怎么样更准确的描述出协作网络和社交网络的区别呢?