ipds-kr
ipds-kr copied to clipboard
<따라 하며 배우는 데이터 과학> (2017) 소스코드
<따라하며 배우는 데이터 과학> (2017) 소스코드
"Introduction to Practical Data Science (IPDS)" (2017)
책 웹사이트: https://dataninja.me/ipds-kr/
목차:
- 데이터 과학이란?
- 데이터 분석 환경 구성하기
- 데이터 취득과 데이터 가공: SQL과 dplyr
- 데이터 시각화 I: ggplot2
- 코딩 스타일
- 통계의 기본 개념 복습
- 데이터 종류에 따른 분석 기법
- 빅데이터 분류분석 I: 기본개념과 로지스틱 모형
- 빅데이터 분류분석 II: 라쏘와 랜덤 포레스트
- 빅데이터 분류분석 III: 암 예측
- 빅데이터 분류분석 IV: 스팸 메일 예측
- 분석결과 정리와 공유, R 마크다운
- 빅데이터 회귀분석 I. 부동산 가격 예측
- 빅데이터 회귀분석 II. 와인 품질 예측
- 데이터 시각화 II: 단어 구름을 사용한 텍스트 데이터의 시각화
- 실리콘 밸리에서 데이터 과학자 되기
사용 전에 깔아야 할 소프트웨어
- R https://www.r-project.org/
- R스튜디오 (RStudio) https://www.rstudio.com/
코드 사용법: R
- 컴퓨터에 git clone 클론해서 사용하세요.
- 각 서브디렉토리는 RStudio 프로젝트입니다.
- 각 서브디렉토리 안에 있는 *.Rproject 파일을 열면 R스튜디오 프로젝트가 열립니다.
- *.R 파일들을 열어서 책을 따라 실행해 보세요.
코드 사용법: 파이썬
주피터 노트북을 notebooks
폴더에서 시작하면 됩니다.
자세한 내용은 https://dataninja.me/ipds-kr/python-setup 을 참조.
Credits
The gapminder data file
notebooks/data/gapminder.tsv
is copied from
https://github.com/jennybc/gapminder/blob/master/data-raw/07_gap-merged-with-continent.tsv
by Jennifer Bryan (NA). gapminder: Data from Gapminder.
https://github.com/jennybc/gapminder,
http://www.gapminder.org/data/,
https://doi.org/10.5281/zenodo.594018.