scikit-learn (sklearn) 官方文档中文版

介绍

sklearn (scikit-learn) 是基于 Python 语言的机器学习工具

简单高效的数据挖掘和数据分析工具
可供大家在各种环境中重复使用
建立在 NumPy ，SciPy 和 matplotlib 上
开源，可商业使用 - BSD许可证

组织构建[网站]

GitHub Pages(国外): https://sklearn.apachecn.org
Gitee Pages(国内): https://apachecn.gitee.io/sklearn-doc-zh

第三方站长[网站]

sklearn 中文文档: http://www.scikitlearn.com.cn
地址A: xxx (欢迎留言，我们完善补充)

其他补充

下载

Docker

docker pull apachecn0/sklearn-doc-zh
docker run -tid -p <port>:80 apachecn0/sklearn-doc-zh
# 访问 http://localhost:{port} 查看文档

PYPI

pip install sklearn-doc-zh
sklearn-doc-zh <port>
# 访问 http://localhost:{port} 查看文档

NPM

npm install -g sklearn-doc-zh
sklearn-doc-zh <port>
# 访问 http://localhost:{port} 查看文档

安装 scikit-learn
用户指南
- 1. 监督学习
  - 1.1. 广义线性模型
  - 1.2. 线性和二次判别分析
  - 1.3. 内核岭回归
  - 1.4. 支持向量机
  - 1.5. 随机梯度下降
  - 1.6. 最近邻
  - 1.7. 高斯过程
  - 1.8. 交叉分解
  - 1.9. 朴素贝叶斯
  - 1.10. 决策树
  - 1.11. 集成方法
  - 1.12. 多类和多标签算法
  - 1.13. 特征选择
  - 1.14. 半监督学习
  - 1.15. 等式回归
  - 1.16. 概率校准
  - 1.17. 神经网络模型（有监督）
- 2. 无监督学习
  - 2.1. 高斯混合模型
  - 2.2. 流形学习
  - 2.3. 聚类
  - 2.4. 双聚类
  - 2.5. 分解成分中的信号（矩阵分解问题）
  - 2.6. 协方差估计
  - 2.7. 新奇和异常值检测
  - 2.8. 密度估计
  - 2.9. 神经网络模型（无监督）
- 3. 模型选择和评估
  - 3.1. 交叉验证：评估估算器的表现
  - 3.2. 调整估计器的超参数
  - 3.3. 模型评估: 量化预测的质量
  - 3.4. 模型持久化
  - 3.5. 验证曲线: 绘制分数以评估模型
- 4. 检验
  - 4.1. 部分依赖图
- 5. 数据集转换
  - 5.1. Pipeline（管道）和 FeatureUnion（特征联合）: 合并的评估器
  - 5.2. 特征提取
  - 5.3 预处理数据
  - 5.4 缺失值插补
  - 5.5. 无监督降维
  - 5.6. 随机投影
  - 5.7. 内核近似
  - 5.8. 成对的矩阵, 类别和核函数
  - 5.9. 预测目标 (y) 的转换
- 6. 数据集加载工具
  - 6.1. 通用数据集 API
  - 6.2. 玩具数据集
  - 6.3 真实世界中的数据集
  - 6.4. 样本生成器
  - 6.5. 加载其他数据集
- 7. 使用scikit-learn计算
  - 7.1. 大规模计算的策略: 更大量的数据
  - 7.2. 计算性能
  - 7.3. 并行性、资源管理和配置
教程
- 使用 scikit-learn 介绍机器学习
- 关于科学数据处理的统计学习教程
  - 机器学习: scikit-learn 中的设置以及预估对象
  - 监督学习：从高维观察预测输出变量
  - 模型选择：选择估计量及其参数
  - 无监督学习: 寻求数据表示
  - 把它们放在一起
  - 寻求帮助
- 处理文本数据
- 选择正确的评估器(estimator.md)
- 外部资源，视频和谈话
API 参考
常见问题
时光轴

历史版本

如何编译使用历史版本:

解压 0.19.x.zip 文件夹
将 master/img 的图片资源, 复制到 0.19.x 里面去
gitbook 正常编译过程，可以使用 sh run_website.sh

贡献指南

为了不断改进翻译质量，我们特此启动了【翻译、校对、笔记整理活动】，开设了多个校对项目。贡献者校对一章之后可以领取千字2~4元的奖励。进行中的校对活动请见活动列表。更多详情请联系飞龙（Q562826179，V:wizardforcel）。

DOCX：开放共享科研记录行动倡议

我们积极响应科研开源计划（DOCX）。如今开源不仅仅是开放源码，还包括数据集、模型、教程和实验记录。我们也在探讨其它类别的开源方案和协议。

希望大家了解这个倡议，把这个倡议与自己的兴趣点结合，做点力所能及的事情。每个人的微小的贡献，汇聚在一起就是整个开源生态。

项目负责人

格式: GitHub + QQ

第一期 (2017-09-29)

第二期 (2019-06-29)

@N!no：1352899627
@mahaoyang：992635910
@loopyme：3322728009
飞龙：562826179
片刻：529815144

-- 负责人要求: (欢迎一起为 sklearn 中文版本 做贡献)

热爱开源，喜欢装逼
长期使用 sklearn(至少0.5年) + 提交Pull Requests>=3
能够有时间及时优化页面 bug 和用户 issues
试用期: 2个月
欢迎联系: 片刻 529815144

贡献者

【0.19.X】贡献者名单

建议反馈

在我们的 apachecn/pytorch-doc-zh github 上提 issue.
发邮件到 Email: [email protected].
在我们的 QQ群-搜索: 交流方式中联系群主/管理员即可.

项目协议

最近有很多人联系我们，关于内容授权问题！
开源是指知识应该重在传播和迭代（而不是禁止别人转载）
不然你TM在GitHub开源，然后又说不让转载，你TM有病吧！
禁止商业化，符合协议规范，备注地址来源，重点: 不需要发邮件给我们申请
ApacheCN 账号下没有协议的项目，一律视为 CC BY-NC-SA 4.0。

温馨提示:

对于个人想自己copy一份再更新的人
我也是有这样的经历，但是这种激情维持不了几个月，就泄气了！
不仅浪费了你的心血，还浪费了更多人看到你的翻译成果！很可惜！你觉得呢？
个人的建议是: fork -> pull requests 到 https://github.com/apachecn/sklearn-doc-zh
那为什么要选择 ApacheCN 呢？
因为我们做翻译这事情是觉得开心和装逼，比较纯粹！
你如果喜欢，你可以来参与/甚至负责这个项目，没有任何学历和背景的限制

赞助我们

sklearn-doc-zh
sklearn-doc-zh copied to clipboard

Metadata

scikit-learn (sklearn) 官方文档中文版

介绍

下载

Docker

PYPI

NPM

目录

历史版本

贡献指南

DOCX：开放共享科研记录行动倡议

项目负责人

贡献者

建议反馈

项目协议

赞助我们

← Metadata

Owner

Metadata

sklearn-doc-zh sklearn-doc-zh copied to clipboard

Metadata

scikit-learn (sklearn) 官方文档中文版

介绍

下载

Docker

PYPI

NPM

目录

历史版本

贡献指南

DOCX：开放共享科研记录行动倡议

项目负责人

贡献者

建议反馈

项目协议

赞助我们

← Metadata

Owner

Metadata

sklearn-doc-zh
sklearn-doc-zh copied to clipboard