Skip to content

TLDX-XIONG/paper-reading

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

32 Commits
 
 
 
 
 
 

Repository files navigation

深度学习论文阅读

对已经读过的论文和将要读的论文进行梳理,以便自己总结。

计算机视觉

经典分类网络

完成 发表时间 标题 封面 贡献
2012 AlexNet 深度学习的开篇之作,第一次将深度学习技术引入图像分类中。在ImageNet分类竞赛中远远领先第二名。使用了两块显卡训练,隐式地使用了分组卷积,第一次提出了一些概念(多GPU,分组卷积,最大池化,ReLU,Dropout),奠定了现代卷积网络的架构。
2013 ZFNet 最大的亮点是利用反卷积可视化技术对卷积核可视化,将特征映射到输入像素空间,增加了网络的可解释性;特征存在层次性,层次越深,特征更具有全局信息,不变性越强。
2014 VGGNet 搭建了一个更深的网络,提出了使用多个小卷积核能够与大卷积核获得相同的感受野,同时能够显著减少参数量。提出了卷积 Block 的概念,通道呈二进制的增加(更能利用计算资源)
2014 GoogLeNet(Inception V1) 提出了在同一层利用多个不同尺度的卷积提取特征,再将得到的特征拼接起来传入下一层作为输入
2015 Inception V2-V3 将大卷积核分解成几个小卷积核;非对称卷积;标签平滑策略
2015 ResNet 提出了残差结构,解决了卷积网络无限堆叠卷积层产生的性能退化问题。使用残差链接能够很好的将深层的 loss 传至浅层,解决了因为链式法则带来的梯度弥散问题。
2016 Inception V4 将 residual 与 inception 结合起来;带残差的 inception 训练速度更快。
2016 DenseNet 在残差连接时,进行通道的 Concatenat 而不是进行简单的相加
2016 Xception 在之前模型基础上使用 depthwise separable 替换传统卷积
2017 ResNext 在 ResNet基础上引入 split-transform-merge 结构(等价于分组卷积),同时使用 module block,使用更少的超参数;在相同参数量的情况下,ResNext 可以使用更大的通道,获得更多的特征图。
2017 SENet 提出了 SE block(使用 chanel attention),使其能更加关注感兴趣、有用的通道特征;可以直接在以前的经典网络中添加 SE blocks;做了很多消融实验验证其有效性
2020 ViT
2021 ConvNext

轻量化网络

完成 发表时间 标题 封面 贡献
2016 SqueezeNet 用 1 * 1 卷积取代 3 * 3 卷积;减少 3 * 3 卷积的输入通道数;将下采样层尽量后置,使得特征图更大,具有更多的特征
2017 MobileNet 使用深度可分离卷积搭建轻量化网络
2018 MobileNet V2 使用深度可分离卷积;Linear Bottlenecks;Inverted residuals
2017 ShuffleNet 使用了分组卷积和通道 shuffle,减少参数量的同时保证了精度
2018 ShuffleNet V2
2019 MobileNet V3
2019 EfficentNet

目标检测

完成 发表时间 标题 封面 贡献
2013 R-CNN 深度学习目标检测经典开山之作。提出Reigon Proposal;使用CNN提取特征;提出 fine-tuning 策略
2014 SPPNet 空间金字塔池化;共享卷积网络提取的特征
2015 Fast R-CNN 采用共享卷积特征;RoI pooling;multi-task loss;网络各组件联合训练
2015 Faster R-CNN 提出 RPN,进一步降低检测时间;使用 anchors 生成先验框
2015 YOLO one stage 目标检测经典之作,将目标检测变成一个回归问题。模型直接端到端训练,达到了实时目标检测水平,同时也保持了较高的性能
2015 SSD 使用多尺度特征进行检测,使用不同卷积层的特征进行检测
2016 YOLO V2 在 yolov1 的基础引入了 anchors 同时使用聚类的策略得到先验 anchors 以提高对小目标的识别;融合不同尺度特征;
2016 YOLO V2 在 yolov1 的基础引入了 anchors 同时使用聚类的策略得到先验 anchors 以提高对小目标的识别;融合不同尺度特征;
2017 RetianNet 提出 focal loss,强调难例的损失,使模型训练时更注重难例;使用了 FPN 网络进行特征融合
2017 Cascade R-CNN
2018 YOLO V3
2020 YOLO V4 对各种 Backbone 和 Tricks 进行梳理和实验,试验了当时所有的 Tricks。
2021 Swin Transformer

语义分割

完成 发表时间 标题 封面 贡献
2014 FCN
2014 DeepLab V1
2015 U-Net
2015 DeconvNet
2015 SegNet
2016 DeepLabV2
2017 Mask R-CNN
2017 DeepLabV3
2018 DeepLabV4

NLP

完成 发表时间 标题 封面 贡献
Transformer

多模态

完成 发表时间 标题 封面 贡献
CLIP
ViLT

深度学习使用的 Tricks

完成 发表时间 标题 封面 贡献
2015 Batch Normalization

重识别

完成 发表时间 标题 封面 贡献

其它

完成 发表时间 标题 封面 贡献

自然语言处理

About

sumary for papers in deep learning/computer vision

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published