DOPMC
DOPMC copied to clipboard
deep-learning-for-computer-vision
你是否已经阅读并同意《Datawhale开源项目指南》?
- [X] 我已阅读并同意《Datawhale开源项目指南》
你是否已经阅读并同意《Datawhale开源项目行为准则》?
- [X] 我已阅读并同意《Datawhale开源项目行为准则》
项目简介
该项目主要是由 Umich EECS 498/598 课程的笔记组成,并加入了个人理解后的代码和找到的其他地方的代码以便学习和理解,并加上关联paper;其中笔记是视频的恰当转录,包含了视频内部的大部分过程(不需要看视频,只看文本也能掌握大概,对时间少的朋友会有帮助)。
课程具体信息如下: Umich EECS 498/598 Deep Learning for Computer Vision 课程安排:https://web.eecs.umich.edu/~justincj/teaching/eecs498/WI2022/schedule.html Youtube 视频链接:https://www.youtube.com/playlist?list=PL5-TkQAfAZFbzxjBHtzdVCWE0Zbhomg7r Umich 课程官网:https://web.eecs.umich.edu/~justincj/teaching/eecs498/FA2019/ https://web.eecs.umich.edu/~justincj/teaching/eecs498/WI2022/ 讲师信息: Justin Johnson 教师主页:https://web.eecs.umich.edu/~justincj/ Justin Johnson 学术主页:https://scholar.google.com/citations?user=mS5k4CYAAAAJ
立项理由
该项目主要源于想认真打基础,选中该课程想要做全套的笔记和扩展知识,由于这个课程极佳,心想可能笔记化后对很多人也有帮助,于是想把自己的笔记过程以及相应实现代码都开源
项目受众
- 所有想要打深度学习基础的朋友
- 所有想要学习计算机视觉的朋友
- 所有想要学好 umich eecs 498.008 的朋友
项目亮点
将该课程恰当文本化、笔记化,同时加入自己觉得有用的学习资料和代码实现(各类拓展代码,或实际应用库如paddle、openmmlab等的操作)。
项目规划
至少包括以下内容: 1.目录(如有多级至少精确到二级) 课程总体包含:1、文本化笔记 2、实现代码 3、补充的paper阅读 涉及到课程的全部内容,以及一些自己的补充如下:
# EECS 498-007 / 598-005: Deep Learning for Computer Vision
## 课程大纲
1. **课程介绍**
- 涵盖计算机视觉概述、历史背景和课程安排。
2. **图像分类**
- 介绍数据驱动的图像识别方法,包括K-最近邻、超参数选择和交叉验证。
3. **线性分类器**
- 探讨线性分类器的不同视角,包括代数、视觉和几何,以及Softmax和支持向量机(SVM)分类器。
4. **正则化与优化**
- 讨论正则化技术、权重衰减、随机梯度下降及其变体,如动量、AdaGrad和Adam优化器。
5. **神经网络**
- 深入特征转换、全连接网络、通用逼近理论和凸性。
6. **反向传播**
- 学习计算图、反向传播算法和矩阵乘法示例。
7. **卷积网络**
- 介绍卷积操作、池化技术、批量归一化等基础卷积网络概念。
8. **CNN架构I**
- 分析不同的卷积神经网络架构,包括BatchNorm、AlexNet、VGG和ResNet。
9. **训练神经网络I**
- 探索激活函数、数据预处理、权重初始化等训练技术。
10. **训练神经网络II**
- 讨论数据增强、正则化技术(如Dropout)、学习率调度和超参数优化。
11. **CNN架构II**
- 介绍分组和可分离卷积、ResNeXt、Squeeze-and-Excite、MobileNets/ShuffleNets、神经架构搜索、EfficientNets和NFNets。
12. **深度学习软件**
- 比较动态图与静态图的区别,并介绍PyTorch和TensorFlow。
13. **目标检测**
- 学习迁移学习、目标检测任务、R-CNN检测器、非极大值抑制(NMS)和平均精度均值(mAP)。
14. **目标检测器**
- 讨论单阶段与双阶段检测器、区域提议网络(RPN)、锚框和特征金字塔网络。
15. **图像分割**
- 探索单阶段检测器、语义分割、实例分割和关键点估计。
16. **循环网络**
- 学习循环神经网络(RNN)、长短期记忆网络(LSTM)、门控循环单元(GRU)、语言建模、序列到序列模型和图像描述。
17. **注意力机制**
- 介绍多模态注意力、自注意力和Transformers模型。
18. **视觉Transformers**
- 讨论视觉Transformer模型,包括ViT、DeiT、Swin Transformer、MViT和DETR。
19. **生成模型I**
- 对比监督与非监督学习、判别式与生成式模型,以及自回归模型和变分自编码器。
20. **生成模型II**
- 深入探讨变分自编码器、生成对抗网络(GAN)、正规化流和扩散模型。
21. **模型可视化与图像生成**
- 学习特征可视化、对抗性示例、DeepDream和风格迁移。
22. **自监督学习**
- 讨论颜色化、修复、对比学习和掩码自编码。
23. **3D视觉**
- 探索3D形状表示、深度估计、3D形状预测以及体素、点云、SDFs和网格。
24. **视频**
- 学习视频分类、早期/晚期融合、3D CNNs、双流网络和基于Transformer的模型。
25. **课程总结**
- 回顾整个课程的内容,并展望计算机视觉的未来发展方向。
2.各章节负责人
- 暂时全部都只有自己 3.各章节预估完成日期 由于要上班,按照课程出笔记大概是一个月至少产出两篇 4.可预见的困难 *加班过长导致业余时间少,速度会慢一些
项目负责人
项目负责人:卢雨畋(散步) GitHub:https://github.com/sanbuphy 邮箱:[email protected]
(也欢迎感兴趣的朋友一起加入)
备注:发起立项申请后DOPMC成员将会在7天内给出审核意见,若7天内无反对意见则默认立项通过~
- [X] 我已知悉上述备注
同意
7天内无反对意见则默认立项通过