Learn_Dive-into-DL-PyTorch
Learn_Dive-into-DL-PyTorch copied to clipboard
Datawhale第10期组队学习活动:《动手学深度学习》Pytorch版的练习代码
Learn_Dive-into-DL-PyTorch
本项目诞生于 Datawhale:whale:第10期组队学习活动:《动手学深度学习》Pytorch版, 由 Datawhale成员安晟维护
《动手学深度学习》是亚马逊首席科学家李沐等人编写的一本优秀的深度学习教学,原书作者:阿斯顿·张、李沐、扎卡里 C. 立顿、亚历山大 J. 斯莫拉以及其他社区贡献者
English Version: Dive into Deep Learning | Github Repo
针对本书的MXNet代码,github分别有中英两个开源版本的Pytorch重构: 中文版Pytorch重构 | 英文版Pytorch重构
本项目正在对以上优质资源的代码进行学习和复现,后期将会力求进一步扩展,补充最新的模型,训练trick,学术进展等
持续更新中...
食用方法
对于已更新完成的部分,每个小节都配备了和原书呼应的markdown教程供阅读,以及对应的源码供大家练习、调试和运行。
此外大家还可以在伯禹学习平台找到相关的视频学习资料动手学深度学习课程页面
在部分涉及比较多理论的章节,为了让公式正常显示,强烈建议安装chrome的MathJax Plugin for Github插件。
目录与代码更新进度
- 阅读指南
- 1. 深度学习简介
- 2. 预备知识
- [ ] 2.1 环境配置
- [ ] 2.2 数据操作
- [ ] 2.3 自动求梯度
- 3. 深度学习基础
- 3.1 线性回归
- [x] 3.1.1 线性回归
- [x] 3.1.2 线性回归的从零开始实现
- [x] 3.1.3 线性回归的简洁实现
- 3.2 softmax回归
- [x] 3.2.1 softmax回归
- [x] 3.2.2 图像分类数据集(Fashion-MNIST)
- [x] 3.2.3 softmax回归的从零开始实现
- [x] 3.2.4 softmax回归的简洁实现
- 3.3 多层感知机
- [x] 3.3.1 多层感知机
- [x] 3.3.2 多层感知机的从零开始实现
- [x] 3.3.3 多层感知机的简洁实现
- [ ] 3.4 模型选择、欠拟合和过拟合
- [ ] 3.5 权重衰减
- [ ] 3.6 丢弃法
- [ ] 3.7 正向传播、反向传播和计算图
- [ ] 3.8 数值稳定性和模型初始化
- [ ] 3.9 实战Kaggle比赛:房价预测
- 3.1 线性回归
- 4. 深度学习计算
- [ ] 4.1 模型构造
- [ ] 4.2 模型参数的访问、初始化和共享
- [ ] 4.3 模型参数的延后初始化
- [ ] 4.4 自定义层
- [ ] 4.5 读取和存储
- [ ] 4.6 GPU计算
- 5. 图片分类入门
- [ ] 5.1 卷积神经网络基础
- [ ] 5.1.1 二维卷积层
- [ ] 5.1.2 填充和步幅
- [ ] 5.1.3 多输入通道和多输出通道
- [ ] 5.1.4 池化层
- [ ] 5.2 LeNet
- [ ] 5.3 AlexNet
- [ ] 5.4 VGG
- [ ] 5.5 网络中的网络(NiN)
- [ ] 5.6 含并行连结的网络(GoogLeNet)
- [ ] 5.7 批量归一化(Batch Normalization)
- [ ] 5.8 残差网络(ResNet)
- [ ] 5.9 数据增强
- [ ] 5.10 迁移学习(权重微调)
- [ ] 5.1 卷积神经网络基础
- 6. 优化算法
- [ ] 6.1 优化与深度学习
- [ ] 6.2 梯度下降和随机梯度下降
- [ ] 6.3 小批量随机梯度下降
- [ ] 6.4 动量法
- [ ] 6.5 AdaGrad算法
- [ ] 6.6 RMSProp算法
- [ ] 6.7 AdaDelta算法
- [ ] 6.8 Adam算法
- 7. 计算性能
- [ ] 7.1 命令式和符号式混合编程
- [ ] 7.2 异步计算
- [ ] 7.3 自动并行计算
- [ ] 7.4 多GPU计算
- 8. 图像分类进阶
- [ ] 8.1 稠密连接网络(DenseNet)
- [ ] 8.2 SENet
- [ ] 8.3 EfficientNet
- 9. 目标检测
- [ ] 9.1 目标检测基础
- [x] 9.1.1 目标检测与边界框
- [ ] 9.2 目标检测数据集
- [x] 9.2.1 皮卡丘数据集
- [x] 9.2.2 VOC数据集
- [ ] 9.2.3 COCO数据集
- [ ] 9.5 多尺度目标检测
- [ ] 9.7 单发多框检测(SSD)
- [ ] 9.8 区域卷积神经网络(R-CNN)系列
- [ ] 9.9 语义分割和数据集
- [ ] 9.10 全卷积网络(FCN)
- [ ] 9.11 样式迁移
- [ ] 9.12 实战Kaggle比赛:图像分类(CIFAR-10)
- [ ] 9.13 实战Kaggle比赛:狗的品种识别(ImageNet Dogs)
- [ ] 9.1 目标检测基础
- 10. 图像分割
- [ ] 10.1 基本概念
- [ ] 10.2 UNet
- 11. 实用工具与工程部署
- [ ] 11.1 tensorBoardX
- 13. 循环神经网络入门
- [ ] 13.1 语言模型
- [ ] 13.2 循环神经网络
- [ ] 13.3 语言模型数据集(周杰伦专辑歌词)
- [ ] 13.4 循环神经网络的从零开始实现
- [ ] 13.5 循环神经网络的简洁实现
- [ ] 13.6 通过时间反向传播
- [ ] 13.7 门控循环单元(GRU)
- [ ] 13.8 长短期记忆(LSTM)
- [ ] 13.9 深度循环神经网络
- [ ] 13.10 双向循环神经网络
持续更新中......
引用
如果您在研究中使用了这个项目请引用原书:
@book{zhang2019dive,
title={Dive into Deep Learning},
author={Aston Zhang and Zachary C. Lipton and Mu Li and Alexander J. Smola},
note={\url{http://www.d2l.ai}},
year={2020}
}