my_blog icon indicating copy to clipboard operation
my_blog copied to clipboard

在 Issues 中建立的个人博客

Results 33 my_blog issues
Sort by recently updated
recently updated
newest added

~~~ 2018-12-08 更新 ~~~ 最新的 RStudio 版本为 1.2.1114,Qt 版本为 Qt-5.11.1。RStudio 自带的 `libQt5*` 文件保存在 `/usr/lib/rstudio/lib` 下,按照之前的方法移除这些文件的办法又失效了。不得已只能又一次自己编译了。 简单记录如下: - 下载 `qt-opensource-linux-x64-5.11.1.run`,安装 - Terminal 临时 `export` 下 `PATH` 和 `LD_LIBRARY_PATH` - 编译 fcitx-qt5...

问题
Linux
软件

![0.cover.BingWallpaper-2018-08-15]( https://github.com/JackieMium/Blog/raw/master/assets/pic/2018/08/issue27/0.cover.BingWallpaper-2018-08-15.jpg) 书接上回。 上回说到,我们首先自己搜索 `d_items` 表格找到对应的 `item_id`,然后运用专业知识对这些 `item_id` 进行筛选和归类,最后得到真正能够定义 CRRT 时间的那些 `item_id`。 下面,我们就要通过最后得到的这些 `item_id` 来制定规则,看看到底 CRRT 的时间是如何对应到这些数据上的。 (上一篇放到 GitHub 上之后发现由于代码基本上都是 SQL,只是通过懒人函数 `query()` 套壳到 R 了,所以粘贴时按照 R 来高亮。导致高亮这么重要的功能基本上算是废了。所以这一篇决定还是直接贴 SQL 代码好了,要用的时候要么放到 psql...

实践
Code
MIMIC
SQL

# 缺失值的简单处理—— MICE 和 Amelia 篇 ![0.cover](https://github.com/JackieMium/my_blog/raw/master/assets/pic/2018/12/issue33/0.cover.jpg) 参考资料: - [Tutorial on 5 Powerful R Packages used for imputing missing values](https://www.analyticsvidhya.com/blog/2016/03/tutorial-powerful-packages-imputing-missing-values/) - Amelia 包文档说明 [Amelia II: A Package for Missing Data](https://r.iq.harvard.edu/docs/amelia/amelia.pdf)...

R
基础
统计

``` 本来是 6 月份的东西,一直没有好好整理拖到年底了,唉.... ``` 毕业答辩过了,最大的坎儿迈过去了。准备开始处理手头拿到的 RNA-Seq 数据。当作是我的第一次实战。 实验设计是干预组和对照组各 4 只大鼠,很简单的 2 * 4 的设计。 首先想到的是看看 [生信菜鸟团](http://www.bio-info-trainee.com/) 有没有实战的 WorkFlow 用来参考,结果刚好就有[一篇 HISAT2 + HT-Seq 的实战帖](http://www.bio-info-trainee.com/2218.html) ,所以就直接照着来一遍先。 最开始以为整个过程应该会比较顺利,因为生信菜鸟团的帖子已经很详细了,而且我手边还有一份 Nature Protocols 的详细的流程参考:[Transcript-level expression...

问题
实践
Bioiformatics

![20180620_13-30-29](https://user-images.githubusercontent.com/12944832/41694392-b8629892-753c-11e8-970c-9d3f7f42e1f6.png) # MIMIC III 数据 + postgreSQL 申请的 [MIMIC III 数据库](https://mimic.physionet.org/about/mimic/) 今天终于通过了,下载发现一堆 `csv.gz` 大小也是惊人。所以自己一一个用表格怕是不可能了,只能去用他们推荐的数据库管理了。 ## 安装和配置 首先第一步就是用官方提供的 [mimin-code](https://github.com/MIT-LCP/mimic-code/tree/master/buildmimic) 来构建数据库了。官方推荐`postgreSQL`,那就用这个好了。 Debian 的话安装`postgresql`倒是没什么,直接`sudo apt install postgresql`就 KO 了。看了一下版本 ```bash ➜ ~ psql...

基础
MIMIC

昨天偶然在网上看到看到关于不同版本 R 的速度对比的文章 [R, R with Atlas, R with OpenBLAS and Revolution R Open: which is fastest?](http://www.brodrigues.co/blog/2014-11-11-benchmarks-r-blas-atlas-rro/),被结果惊到了,最快的 Revolution R Open 碾压 Vanilla R,而且相比 OPENBLAS 和 ATLAS R 都有优势,简直是孤独求败。然后我搜了一下,发现 Revolution R...

问题
Linux
R
软件

![0.cover.jpg]( https://github.com/JackieMium/my_blog/raw/master/assets/pic/2018/09/issue31/0.cover.jpg) 主要参考博文 : - [Dealing with The Problem of Multicollinearity in R](https://r-posts.com/dealing-with-the-problem-of-multicollinearity-in-r/) - [Multicollinearity in R](https://datascienceplus.com/multicollinearity-in-r/) ## 引子 如果现在我们预测一个国家,比如说中国,2018 年全年的旅游收入(美元)。因变量是中国 2018 年度的旅游收入 Y,自变量 X 我们假设存在下面两组: 1. X1 = 2018...

R
基础
统计

![cover](https://github.com/JackieMium/Blog/raw/master/assets/pic/2018/08/issue26/0.cover.png) 花了几天时间把 [`mimic-code/notebooks/crrt-notebook.ipynb`](https://github.com/MIT-LCP/mimic-code/blob/master/notebooks/crrt-notebook.ipynb) 从头到尾看了一遍。虽然消化得还不是很好,但是觉得这一篇教程真的是干货满满。决定还是花点时间仔细再整理一下。和前面一样,我还是尽量放到 R 里做,R 不好做的我再到 Juputer 里做。R 的设置在上一篇里写过,这里我就只写 Python 里的准备工作了。需要的东西有: - PostgreSQL 运行,本地建立好 MIMIC-III 数据库 - Python,我是 conda 环境的 Python 3.6。使用 Jupyter 的话当然还得搭配浏览器 - R,最好搭配 RStudio ------- 这个记事本(因为教程以...

实践
Code
MIMIC
SQL

mimic-code 的 `tutorials`还提供了 `sql-crosstab`,很短,我大概看了感觉不是很有用,先放着了。`using_r_with_jupyter.ipynb` 就是教你怎么用 Jupyter + R,没什么。`explore-items.Rmd` 是 MySQL + R,但是没太搞懂这是在干嘛,而且我也没 MySQL,代码转 Postgres 应该不难,我太懒了。直接看最后一个,`cohort-selection.ipynb`,打开看了 Postgres + Python,讲怎么选择病例队列的一些小技巧,感觉写得挺好的。就这个了,开始。 原文档用的 Python,我不喜欢。当然还是 R 好啦,所以我直接用里面的 `sql` 语句就行了。 ----- ## Cohort selection The aim...

实践
Code
MIMIC
SQL

![0.BingWallpaper-2018-08-25.jpg](https://github.com/JackieMium/my_blog/raw/master/assets/pic/2018/08/issue30/0.BingWallpaper-2018-08-25.jpg) 最近学学 Python 做数据分析,主要就是 Python 基本语法 + NumPy + pandas 咯。 发现很好的一些教程: - [python_for_data_analysis_2nd_chinese_version](https://github.com/iamseancheney/python_for_data_analysis_2nd_chinese_version) - [Numpy & Pandas (莫烦 Python 数据处理教程)]() - [Data analysis in Python with pandas](https://www.youtube.com/playlist?list=PL5-da3qGB5ICCsgW1MxlZ0Hq8LL5U3u9y) 果然人生苦短,大家都在用 Python。好教程都一搜一大把。然后今天在...

基础
Python