Xingyu.Wang

Results 21 issues of Xingyu.Wang

While using it for large file, the output will scrolling long-long time , and piping to `more` will output bad string . So, please add pager to output .

根据项目主体代码,将所分析的项目分成几类: - 文档类项目,以 markdown、html 为主体的项目 - 前端类项目,以 javascript、css(及预处理器) 为主体的项目 - 开发类项目,以其它源代码为主体的项目 以上三类项目的开发和活跃度模式相差比较大,应该分别进行排行。

enhancement
good first issue

这导致大量的提交被丢弃,项目数据失衡。 需要仔细排查此问题产生的原因,以及是否有规避方式。

help wanted

应该建立一个数据配置数据库(文本或 json): - 以组织(用户)或仓库名为主键, - 指定仓库时,包括其组织(用户),格式为“组织/仓库名” - 其下级数据指定对该数据的配置: - 非社区化匹配规则:以正则表达式方式来匹配贡献者的邮件域,配置则为企业人员 - 对于组织/用户,会遍历其名下的所有仓库,可指定筛选条件,可支持: - star:最小 star 数要求 - last_commit:最后提交的时间 - first_commit:首次提交的时间(即仓库创建时间) - 等等 - 强制分类:默认仓库会根据其首选语言分为文档类、前端类和代码类项目,但是可以在此强制指定。 - 数据采集范围:如没有指定,采用系统配置数据 - start: 采集开始时间 -...

enhancement
good first issue

这个关键字目前是设置在 ini 中,应该是根据命令行参数指定的组织或项目名来指定。

enhancement

应该可以根据项目的数据收集过程中,同时生成该组织的这个数据的汇总(非活跃度累计,而是构成活跃度的基础数据的累计,并运算),以生成该组织的该时间点的活跃度指标。

enhancement

当重复分析同一个项目(组织/仓库)时,后来的数据应该覆盖前一个数据。 此外,判断重复的主键是: 组织/仓库 ,或者 组织。

需要编写一个前端程序(不指 web 界面),用于从特定的数据源抽取要进行数据分析的 github 项目。 目前考虑的数据源有: - 开发者名下的: http://outofmemory.cn/github/ - 企业名下的:https://github.com/jaywcjlove/handbook/blob/master/other/Github-Oraganizations.md 该程序需要从此自动获取 organ ,并采用 organ 命令进行抓取。 考虑到项目分类各异和数据参差,应该需要前置工作 #6 的项目分类,并对筛选 star 数超过 100 项目。

enhancement
help wanted

每个项目在一个时间点的活跃度是以一个三维坐标(提交数增量、拉取请求数增量、贡献者数增量)确定的,因此可以用 SVG 结合 D3.JS 来绘制一个根据时间变化的动画图。 也应该可以支持多个项目的该指标的同时展示。 于此,我希望最终是一个Web 界面,可以勾选或输入(一个或多个)项目名称,选择时间范围,然后生成可视化的展示,并可设置时间流速。

help wanted

## 预期动作 自动根据添加机器人好友的微信用户的属性,主动发送加群邀请,预期的条件可能有: - 性别,如将性别表示为“女”的用户拉到一个群 - 城市,如根据城市拉到不同的城市群 - 年龄,如判断年龄处于上学阶段,拉到学生群 ## 当前动作 无 ## 可能的解决方案 读取加好友的用户属性,如果不可行,则忽略。