cosx.org
cosx.org copied to clipboard
统计月读(2023年12月)
请回复 issue 进行文章推荐与招聘投稿,内容须与统计/数据科学相关,是否采纳取决于编辑部意见。
文章推荐包括学术论文、博客、书籍、教程或软件等的推荐,如果是英文文章在月报发布后自动作为翻译备选文章。
招聘主要面向学术界与工业界的招聘信息发布且岗位要与统计/数据科学相关。
文章推荐格式如下:
推荐语:(几句话就可以,可长可短,有态度不严肃)
推荐人:(建议用真名)
链接:(论文建议给doi,其余给链接)
招聘信息格式如下:
岗位介绍:(例如博士生、博后、xx公司软件工程师等)
工作地点:(具体到城市)
联系方式:(网站链接或邮箱)
推荐语:想做甘特图,在线网页看上去效果很好很完善但是真的用起来结果一团糟,发现 mermaid.js 很适合用代码形式绘制流程图甘特图等图表,在 R 中使用 DiagrammeR
包即可直接调用。
推荐人:任焱
链接:https://www.rdocumentation.org/packages/DiagrammeR/versions/1.0.10/topics/mermaid
推荐语:当样本缺乏代表性时,基于已知人口学特征进行事后分层(post-stratification)加权是常用技巧。但如果具体层次的样本量很少,该层点估计会面临较大误差。对此,可以利用多层模型的shrinkage特性,获得每层更稳健的点估计,然后再加权汇总。
推荐人:董书昊
链接(两篇文章):
- https://www.monicaalexander.com/posts/2019-08-07-mrp/
- https://marginaleffects.com/vignettes/mrp.html
推荐语:R语言书籍的推荐,附有介绍和免费获取电子版的链接
推荐人:孔令仁
链接:https://oscarbaruffa.com/the-10-most-popular-r-books-of-2023/
推荐语:推荐R包MIDAS,可用于混频数据回归
推荐人:朱书慧
链接:Ghysels, E., Kvedaras, V., & Zemlys, V. (2016). Mixed Frequency Data Sampling Regression Models: The R Package midasr. Journal of Statistical Software, 72(4), 1–35. https://doi.org/10.18637/jss.v072.i04
推荐语:gspcr
用于广义线性模型的有监督 PCA,可以支持连续型、离散型和二分类型的结局变量。想做使用有监督 PCA 的逻辑回归时发现的,是最近才上传的一个包。
推荐人:宋文轩
推荐语:LLM 如何切实帮助 R coder,chattr
只是在 R 内部提供了 ChatGPT 接口,gptstudio
更像一个内置工具。文章还从改善 http 请求效率(使用 SSEparser
包)的角度对上述 API 做了改进,值得一读。
推荐人:任焱
链接:https://samuelenrique.com/posts/2023-12-14-launching-sseparser/
推荐语:看不懂别人的代码一定要用用这个小工具,可以解释多种代码,会从代码结构,可能出现的bug,修改建议等等进行分析。
推荐人:任焱
链接:https://codepal.ai/code-explainer/r
推荐语:因果推断与机器学习结合方法的python包,里面包含的方法很多,比如DML、DRL、正交随机树等,讲解也很细致,很实用~
推荐人:孔子怡
链接:https://econml.azurewebsites.net/spec/estimation/dml.html#what-is-it
推荐语:一个经典结论的再现。由于上学通常会卡年龄(比如加拿大会卡在当年1月1日),在低年级时,体育队里往往大部分人会是同一年级中更早出生的那批人(发育了更长的时间)。例如在加拿大,体育队中年初出生的人较多,但也可能是因为更多的人本身就出生在年初。作者拿加拿大人口数据和NHL中加拿大球员的出生数据进行了研究,即对比两个分布是否相同。发现相比正常出生情况,NHL中的确有更多的加拿大人在年初出生。
推荐人:王祎帆
链接:https://jlaw.netlify.app/2023/12/04/are-birth-dates-still-destiny-for-canadian-nhl-players/