Skip to content

PrestonYU/DeepLearning-ComputerVision-Marathon-Challenge

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

57 Commits
 
 
 
 

Repository files navigation

第一屆深度學習(Deep Learning)與電腦視覺(Computer Vision)馬拉松

Cupoy 1st Deep Learning & Computer Vision Marathon

基礎影像處理

學習影像處理基礎,並熟悉 OpenCV 寫作方式以及如何前處理

  1. OpenCV 簡介 + 顯示圖片: 入門電腦視覺領域的重要套件: OpenCV
  2. Color presentation 介紹 (RGB, LAB, HSV): 淺談圖片不同的表示方式
  3. 顏色相關的預處理 (改變亮度, 色差): 透過圖片不同的表示方式實作修圖效果
  4. 以圖片為例做矩陣操作 (翻轉, 縮放, 平移): 淺談基礎的幾合變換: 翻轉 / 縮放 / 平移
  5. 透過 OpenCV 做圖並顯示 (長方形, 圓形, 直線, 填色): 實作 OpenCV 的小畫家功能
  6. affine transformation 概念與實作: 仿射轉換的入門與實作: affine transform
  7. perspective transformation 概念與實作: 視角轉換的入門與實作: perspective transform
  8. Filter 操作 (Sobel edge detect, Gaussian Blur): 初探邊緣檢測與模糊圖片操作: 了解 filter 的運用
  9. SIFT 介紹與實作 (feature extractor): SIFT: 介紹與實作經典的傳統特徵
  10. SIFT 其他應用 (keypoint matching): SIFT 案例分享: 特徵配對

電腦視覺深度學習基礎

打好卷積神經網路的概念,並了解 CNN 各種代表性的經典模型

  1. CNN分類器架構:卷積層: 卷積是CNN的核心,了解卷積如何運行 就能幫助我們理解CNN的原理
  2. CNN分類器架構:步長、填充: 填充與步長是CNN中常見的超參數, 了解如何設置能幫助我們架構一個CNN Model
  3. CNN分類器架構:池化層、全連接層: 池化層時常出現於CNN結構中,而FC層則會接在模型輸出端, 了解如兩者用途能幫助我們架構一個CNN Model
  4. CNN分類器架構:Batch Normalization: Batch Normalization出現在各種架構中, 了解BN層能解決怎樣的問題是我們本章的重點
  5. 訓練一個CNN分類器:Cifar10為例: 綜合上述CNN基本觀念, 我們如何結合這些觀念打造一個CNN 模型
  6. 如何使用Data Augmentation: 訓練模型時常常會遇到資料不足的時候,適當的使用Image Augmentation能提升模型的泛化性
  7. AlexNet: 綜合之前所學的CNN觀念,認識第一個引領影像研究方向朝向深度學習的模型
  8. VGG16 and 19: 模型繼續進化,認識簡單卻又不差的CNN模型
  9. InceptionV1-V3: Inception module提供大家不同於以往的思考方式,將模型的參數量減少,效能卻提升了許多
  10. ResNetV1-V2、InceptionV4、Inception-ResNet: 首次超越人類分類正確率的模型,Residual module也影響了後來許多的模型架構
  11. Transfer learning: 學習如何利用前人的知識輔助自己訓練與跨領域學習的方法
  12. Breaking Captchas with a CNN: 了解如何使用CNN+CTC判定不定長度字串

CNN 應用案例學習

學習目前最常使用的 CNN 應用案例:YOLO 物件偵測實務完全上手

Object detection

  1. Object detection原理: 了解Object Detection出現的目的與基本設計原理
  2. Object detection基本介紹、演進: 了解Object Detection一路發展下來,是如何演進與進步
  3. Region Proposal、IOU概念: IOU是貫穿Object Detection的一個重要觀念,了解如何計算IOU對了解Object Detection中許多重要步驟會很有幫助
  4. RPN架構介紹: RPN是Faster RCNN成功加速的關鍵,了解RPN便能深入認識Faster RCNN
  5. Bounding Box Regression原理: 所有的Object Detection模型都需要做Bounding Box的Regression,了解其是如何運作的能幫助我們更認識Object Detection
  6. Non-Maximum Suppression (NMS)原理: 所有的Object Detection模型都有Non Maximum Suppression的操作,了解其是如何運作的能幫助我們更認識Object Detection
  7. 程式導讀、實作: 了解如何搭建一個SSD模型

YOLO

  1. YOLO 簡介及算法理解: 了解 YOLO 的基本原理
  2. YOLO 細節理解 - 網路輸出的後處理: 理解網路輸出的後處理,執行nms的過程
  3. YOLO 細節理解 - 損失函數: 認識YOLO損失函數設計架構與定義
  4. YOLO 細節理解 - 損失函數程式碼解讀: 講解YOLO損失函數程式碼
  5. YOLO 細節理解 - 網路架構: 了解YOLO網絡架構的設計與原理
  6. YOLO 細節理解 - 網路架構程式碼解讀: 講解YOLO網絡架構程式碼
  7. YOLO 演進: 簡單了解 YOLO 的演進
  8. 使用 YOLOv3 偵測圖片及影片中的物件: 了解如何基於現有的 YOLOv3 程式碼客制化自己的需求
  9. 更快的檢測模型 - tiny YOLOv3: 了解如何使用 tiny YOLOv3 來滿足對檢測速度的需求
  10. 訓練 YOLOv3: 了解如何訓練 YOLOv3 檢測模型

電腦視覺深度學習實戰

人臉關鍵點檢測及其應用

  1. 人臉關鍵點-資料結構簡介: 探索 kaggle 臉部關鍵點資料
  2. 人臉關鍵點-檢測網路架構: 學習用 keras 定義人臉關鍵點檢測的網路架構
  3. 訓練人臉關鍵點檢測網路: 體會訓練人臉關鍵點檢測網路的過程
  4. 人臉關鍵點應用: 體驗人臉關鍵點的應用 - 人臉濾鏡
  5. Mobilenet: 輕量化模型簡介 (MobileNet)
  6. Mobilenetv2: MobileNet v2 簡介
  7. Tensorflow Object Detection API: Tensorflow Object Detection API使用方式