0801-深度學習程式架構設計

2021 年 5 月 3 日
筆記
torch_long

0801-深度學習程式架構設計

一、程式架構設計
二、文件組織結構
三、關於 __init__.py

pytorch完整教程目錄：//www.cnblogs.com/nickchen121/p/14662511.html

前幾章已經把 pytorch 的大部分基礎知識講的很詳細了，足夠我們未來的使用，但是如果你想更加詳細的了解 pytorch 的使用方法，推薦去閱讀 pytorch 的官方文檔，而不是去看其他作者寫的書籍或者部落格，因為所有人的文章都不過是對官方文檔做了自己的見解罷了。

接下來我們將給大家講解一個又一個項目實戰，但是本章的重點還不是帶你去使用 pytorch 的介面，去構建一個花里胡哨的項目，更多的是帶你去了解一個程式的架構，也就是說這一章將會帶領同學們去合理地設計程式的結構，讓你們的程式更具可讀性、更易用。

一、程式架構設計

學習某個深度學習框架時，掌握它的基本知識和介面雖然重要，但是如何合理地組織程式碼，讓程式碼具有良好的可讀性和擴展性也是很重要的。為此，本章更多的是講解經驗性的東西，又因為這些經驗涉及的更多是個人喜好和程式碼風格，這種喜好每個人應該都是不一樣的，為此在參考這些經驗時可以把它當做是一種參考或提議。

在做深度學習實驗和項目時，為了得到最優的模型結果，中間往往需要很多次的嘗試和修改。但是如果能夠合理地組織文件結構，以及使用一些小技巧可以極大地提高程式碼的易讀易用性。根據作者的經驗，在大多數深度學習的項目研究時，程式都需要實現以下幾個功能：

模型定義
數據處理和載入
訓練模型（Train & Validate）
訓練過程可視化
測試（Test/Inference）

除了上述所說的，程式應該還要滿足以下幾個要求：

模型需要具有高度可配置型，方便修改參數、修改模型和反覆實驗
程式碼需要具有良好的組織結構，讓人一目了然
程式碼應該要有良好的說明，讓他人能夠了解

二、文件組織結構

前面提到過程式的主要功能，其中最重要的三個功能如下：

模型定義
數據載入
訓練和測試

首先來看程式文件的組織結構：

checkpoints/
data/
    __init__.py
    dataset.py
    get_data.sh

models/
    __init__.py
    AlexNet.py
    BasicModule.py
    ResNet34.py
    
utils/
    __init__.py
    visualize.py
    
config.py
main.py
requirement.txt
README.md

上式各個文件的主要內容和作用如下：

checkpoints/：用於保存訓練好的模型，可讓程式在異常退出後仍然能夠重新載入模型，恢復訓練
data/：數據相關操作，包括數據預處理、dataset 實現等
models/：模型定義，可以有多個模型，例如上面的 AlexNet 和 ResNet34，一個模型對應一個文件
utils/：可能用到的工具函數，本次實驗中主要封裝了可視化工具
config.py：配置文件，所有可配置的變數都集中在此，並提供默認值
main.py：主文件，訓練和測試程式的入口，可通過不同的命令來指定不同的操作和參數
requirements.txt：程式依賴的第三方庫
README.md：提供程式的必要說明

三、關於 `init.py`

想詳細了解 __init__.py 的同學們可以參考這篇部落格：//www.cnblogs.com/nickchen121/p/10804427.html

可以看到幾乎每個文件夾下都有 init 這個文件，一個目錄中如果包含了 init 文件，那麼它就變成了一個包。init 可以為包，也可以定義包的屬性和方法，但是它必須存在，因為其他程式才能從這個目錄中導入相應的模組或函數。

例如在 data 文件夾下有 init 文件，在 main 中就可以 from data.dataset import DogCat。如果在 data 中的 init 中寫入 from .dataset import DogCat，則可以在 main 中就可以直接寫成 from data import DogCat，或者 import data; dataset = data.DogCat，比寫為 from data.dataset import DogCat 更便捷。

Tags: torch_long