Multivariate-Statistics-Self-Learning icon indicating copy to clipboard operation
Multivariate-Statistics-Self-Learning copied to clipboard

应用多元统计分析(高慧璇版)自学材料

Multivariate-Statistics-Self-Learning

记录多元统计分析的数据、代码、结果。

目录

  • 课程教材
  • 例题作业代码
  • 平时作业
  • 期末大作业

课程教材

《应用多元统计分析》, 高慧璇, 北京大学出版社.

配套资料:课程网站上有ppt、例题SAS代码和部分习题解答。

推荐阅读:

说明:教材例题只给了SAS代码, R语言实战是很好的补充, 而且讲得比这本书更偏向于应用;

代码

  • 第三章 多元正态总体参数的假设检验

    • 多总体均值向量的检验(多元方差分析manova)
    • 一元数据正态性检验的多种方法
    • 多元数据正态性检验的卡方图检验法(P-P plot & Q-Q plot)
  • 第四章 回归分析

    • 我跳过了第四章, 回归分析是另一门课程的内容.
  • 第五章 判别分析

    • 距离判别法
    • 其他方法
      • 广义平方距离判别法
      • lda(Linear Discriminant Analysis)
      • qda(Quadratic Discriminant Analysis)
  • 第六章 聚类分析

    • 系统聚类(层次聚类)
    • K-means和围绕中心点划分聚类
    • 有序样品聚类(最优分割法)
  • 第七章 主成分分析

    • 主成分分析 指标分类 主成分回归
  • 第八章 因子分析

    • 因子分析
  • 第九章 对应分析方法

    • 对应分析
  • 第十章 典型相关分析

    • 典型相关分析
  • 第十一章 偏最小二乘回归分析

    • 偏最小二乘回归分析

平时作业

平时作业已全部上传到我的博客里 在这个页面:https://lucajiang.github.io/2020/11/27/Multivariate-Statistics-HW/

期末大作业

  • Kaggle 蘑菇数据集:辨别蘑菇是否可食用

可以在此处围观大作业的pdf文件:https://lucajiang.github.io/2020/11/16/Kaggle-Mushroom-Dataset/

最后

很有意思的是, 2017级多元统计课程并没有选用这本书作为教材, 而是选用了Modern Multivariate Statistical Techniques-- 一本介绍现代多元统计的英文书作为教材. 课程内容包括: 主成分分析 线性判别分析 决策树 聚类分析 支持向量机 集成学习等.

以及, 感谢star本项目的同学给我的支持. 欢迎大家顺手去逛逛我的个人博客.

大作业使用的模型包括: 主成分回归、线性判别分析、LASSO 回归、逐步回归、决策树(CART、C4.5、C5.0)、 随机森林、XGBoost、kNN、SVM 、NN、RIPPER 和 PART(两个类似决策树的模型,虽然很多教材都没涉及,但尤其适合我选择的数据集). 涉及了数据的探索性分析,预处理,建模等内容. 如果感兴趣, 可以看看.

附 Modern Multivariate Statistical Techniques 教材主页的网址: https://astro.temple.edu/~alan/MMST/

最近MMST主页崩了, 数据可以从 https://github.com/cran/MMST 下载.