如何在 PyTorch 中定義 CNN 的架構？

PyTorch 中卷積神經網絡 (CNN) 的架構是指其各個組件的設計和排列，例如卷積層、池化層、全連接層和激活函數。該架構決定了網絡如何處理和轉換輸入數據以產生有意義的輸出。在這個答案中，我們將詳細而全面地解釋 PyTorch 中 CNN 的架構，重點關注其關鍵組件及其功能。

CNN 通常由按順序排列的多個層組成。第一層通常是卷積層，它對輸入數據執行卷積的基本操作。卷積涉及將一組可學習的過濾器（也稱為內核）應用於輸入數據以提取特徵。每個過濾器在其權重和輸入的局部感受野之間執行點積，生成特徵圖。這些特徵圖捕獲輸入數據的不同方面，例如邊緣、紋理或圖案。

在卷積層之後，非線性激活函數按元素應用於特徵圖。這將非線性引入網絡，使其能夠學習輸入和輸出之間的複雜關係。 CNN 中使用的常見激活函數包括 ReLU（修正線性單元）、sigmoid 和 tanh。 ReLU 由於其簡單性和緩解梯度消失問題的有效性而被廣泛使用。

在激活函數之後，通常採用池化層來減少特徵圖的空間維度，同時保留重要特徵。池化操作（例如最大池化或平均池化）將特徵圖劃分為不重疊的區域，並聚合每個區域內的值。這種下採樣操作降低了網絡的計算複雜性，並使其對輸入的變化更加魯棒。

卷積層、激活層和池化層通常會重複多次，以從輸入數據中提取越來越抽象和高級的特徵。這是通過增加每個卷積層中的濾波器數量或將多個卷積層堆疊在一起來實現的。網絡的深度使其能夠學習輸入的分層表示，捕獲低級和高級特徵。

特徵提取過程完成後，輸出將被展平為一維向量並通過一個或多個全連接層。這些層將一層中的每個神經元連接到下一層中的每個神經元，從而允許學習複雜的關係。全連接層通常用於網絡的最後層，將學習到的特徵映射到所需的輸出，例如圖像分類任務中的類概率。

為了提高網絡的性能和通用性，可以應用各種技術。正則化技術（例如 dropout 或批量歸一化）可用於防止過度擬合併提高網絡泛化到未見過的數據的能力。 Dropout 在訓練期間隨機將一部分神經元設置為零，迫使網絡學習冗餘表示。批量歸一化對每一層的輸入進行歸一化，減少內部協變量偏移並加速訓練過程。

PyTorch 中 CNN 的架構涵蓋其組件的排列和設計，包括卷積層、激活函數、池化層和全連接層。這些組件協同工作，從輸入數據中提取和學習有意義的特徵，使網絡能夠做出準確的預測或分類。通過仔細設計架構並結合正則化等技術，可以提高網絡的性能和泛化能力。