sklearn-doc-zh icon indicating copy to clipboard operation
sklearn-doc-zh copied to clipboard

:book: [译] scikit-learn(sklearn) 中文文档

scikit-learn (sklearn) 官方文档中文版

logo

sklearn 0.21.3 中文文档 sklearn 0.21.3 中文示例 sklearn 英文官网


介绍

sklearn (scikit-learn) 是基于 Python 语言的机器学习工具

  1. 简单高效的数据挖掘和数据分析工具
  2. 可供大家在各种环境中重复使用
  3. 建立在 NumPy ,SciPy 和 matplotlib 上
  4. 开源,可商业使用 - BSD许可证

组织构建[网站]

  • GitHub Pages(国外): https://sklearn.apachecn.org
  • Gitee Pages(国内): https://apachecn.gitee.io/sklearn-doc-zh

第三方站长[网站]

  • sklearn 中文文档: http://www.scikitlearn.com.cn
  • 地址A: xxx (欢迎留言,我们完善补充)

其他补充

下载

Docker

docker pull apachecn0/sklearn-doc-zh
docker run -tid -p <port>:80 apachecn0/sklearn-doc-zh
# 访问 http://localhost:{port} 查看文档

PYPI

pip install sklearn-doc-zh
sklearn-doc-zh <port>
# 访问 http://localhost:{port} 查看文档

NPM

npm install -g sklearn-doc-zh
sklearn-doc-zh <port>
# 访问 http://localhost:{port} 查看文档

目录

  • 安装 scikit-learn
  • 用户指南
    • 1. 监督学习
      • 1.1. 广义线性模型
      • 1.2. 线性和二次判别分析
      • 1.3. 内核岭回归
      • 1.4. 支持向量机
      • 1.5. 随机梯度下降
      • 1.6. 最近邻
      • 1.7. 高斯过程
      • 1.8. 交叉分解
      • 1.9. 朴素贝叶斯
      • 1.10. 决策树
      • 1.11. 集成方法
      • 1.12. 多类和多标签算法
      • 1.13. 特征选择
      • 1.14. 半监督学习
      • 1.15. 等式回归
      • 1.16. 概率校准
      • 1.17. 神经网络模型(有监督)
    • 2. 无监督学习
      • 2.1. 高斯混合模型
      • 2.2. 流形学习
      • 2.3. 聚类
      • 2.4. 双聚类
      • 2.5. 分解成分中的信号(矩阵分解问题)
      • 2.6. 协方差估计
      • 2.7. 新奇和异常值检测
      • 2.8. 密度估计
      • 2.9. 神经网络模型(无监督)
    • 3. 模型选择和评估
      • 3.1. 交叉验证:评估估算器的表现
      • 3.2. 调整估计器的超参数
      • 3.3. 模型评估: 量化预测的质量
      • 3.4. 模型持久化
      • 3.5. 验证曲线: 绘制分数以评估模型
    • 4. 检验
      • 4.1. 部分依赖图
    • 5. 数据集转换
      • 5.1. Pipeline(管道)和 FeatureUnion(特征联合): 合并的评估器
      • 5.2. 特征提取
      • 5.3 预处理数据
      • 5.4 缺失值插补
      • 5.5. 无监督降维
      • 5.6. 随机投影
      • 5.7. 内核近似
      • 5.8. 成对的矩阵, 类别和核函数
      • 5.9. 预测目标 (y) 的转换
    • 6. 数据集加载工具
      • 6.1. 通用数据集 API
      • 6.2. 玩具数据集
      • 6.3 真实世界中的数据集
      • 6.4. 样本生成器
      • 6.5. 加载其他数据集
    • 7. 使用scikit-learn计算
      • 7.1. 大规模计算的策略: 更大量的数据
      • 7.2. 计算性能
      • 7.3. 并行性、资源管理和配置
  • 教程
    • 使用 scikit-learn 介绍机器学习
    • 关于科学数据处理的统计学习教程
      • 机器学习: scikit-learn 中的设置以及预估对象
      • 监督学习:从高维观察预测输出变量
      • 模型选择:选择估计量及其参数
      • 无监督学习: 寻求数据表示
      • 把它们放在一起
      • 寻求帮助
    • 处理文本数据
    • 选择正确的评估器(estimator.md)
    • 外部资源,视频和谈话
  • API 参考
  • 常见问题
  • 时光轴

历史版本

如何编译使用历史版本:

  • 解压 0.19.x.zip 文件夹
  • master/img 的图片资源, 复制到 0.19.x 里面去
  • gitbook 正常编译过程,可以使用 sh run_website.sh

贡献指南

为了不断改进翻译质量,我们特此启动了【翻译、校对、笔记整理活动】,开设了多个校对项目。贡献者校对一章之后可以领取千字2~4元的奖励。进行中的校对活动请见活动列表。更多详情请联系飞龙(Q562826179,V:wizardforcel)。

DOCX:开放共享科研记录行动倡议

我们积极响应科研开源计划(DOCX)。如今开源不仅仅是开放源码,还包括数据集、模型、教程和实验记录。我们也在探讨其它类别的开源方案和协议。

希望大家了解这个倡议,把这个倡议与自己的兴趣点结合,做点力所能及的事情。每个人的微小的贡献,汇聚在一起就是整个开源生态。

项目负责人

格式: GitHub + QQ

第一期 (2017-09-29)

第二期 (2019-06-29)

-- 负责人要求: (欢迎一起为 sklearn 中文版本 做贡献)

  • 热爱开源,喜欢装逼
  • 长期使用 sklearn(至少0.5年) + 提交Pull Requests>=3
  • 能够有时间及时优化页面 bug 和用户 issues
  • 试用期: 2个月
  • 欢迎联系: 片刻 529815144

贡献者

【0.19.X】贡献者名单

建议反馈

项目协议

  • 最近有很多人联系我们,关于内容授权问题!
  • 开源是指知识应该重在传播和迭代(而不是禁止别人转载)
  • 不然你TM在GitHub开源,然后又说不让转载,你TM有病吧!
  • 禁止商业化,符合协议规范,备注地址来源,重点: 不需要发邮件给我们申请
  • ApacheCN 账号下没有协议的项目,一律视为 CC BY-NC-SA 4.0

温馨提示:

  • 对于个人想自己copy一份再更新的人
  • 我也是有这样的经历,但是这种激情维持不了几个月,就泄气了!
  • 不仅浪费了你的心血,还浪费了更多人看到你的翻译成果!很可惜!你觉得呢?
  • 个人的建议是: fork -> pull requests 到 https://github.com/apachecn/sklearn-doc-zh
  • 那为什么要选择 ApacheCN 呢?
  • 因为我们做翻译这事情是觉得开心和装逼,比较纯粹!
  • 你如果喜欢,你可以来参与/甚至负责这个项目,没有任何学历和背景的限制

赞助我们

微信&支付宝