為什麼訓練的評估是80%，評估的評估是20%，而不是相反？

by 阮春東 / 週四17 2023八月 / 出版於人工智能, EITC/AI/GCML Google雲機器學習, 機器學習的第一步, 機器學習的7個步驟

在機器學習背景下，將 80% 的權重分配給訓練，將 20% 的權重分配給評估，這是基於多個因素的戰略決策。這種分佈旨在優化學習過程和確保准確評估模型性能之間取得平衡。在本次回應中，我們將深入探討這一選擇背後的原因，並探討其提供的教學價值。

要理解 80% 訓練和 20% 評估劃分背後的基本原理，了解機器學習的七個步驟至關重要。這些步驟包括數據收集、數據準備、模型訓練、模型評估、模型調整、模型部署和模型監控，形成了構建機器學習模型的綜合框架。

第一步是數據收集，涉及收集相關數據來訓練模型。然後在數據準備階段對該數據進行預處理和準備。數據準備好後，模型訓練階段就開始，模型將暴露於訓練數據集以學習模式和關係。然後在模型評估階段使用單獨的數據集來評估模型的性能。

將 80% 的權重分配給訓練，將 20% 的權重分配給評估的決定源於這樣一個事實：訓練是模型從數據中學習的主要階段。在訓練期間，模型調整其內部參數以最小化其預測輸出與訓練數據集中的實際輸出之間的差異。此過程涉及使用梯度下降等優化算法迭代更新模型的參數。

通過為訓練分配更高的權重，我們優先考慮模型從數據中學習和捕獲複雜模式的能力。訓練階段是模型獲取知識並從訓練數據集中進行概括以對未見過的數據進行預測的階段。模型接觸的訓練數據越多，它的學習和泛化能力就越好。因此，將評估過程的很大一部分用於訓練可確保模型充分接觸訓練數據以進行有效學習。

另一方面，評估階段在評估模型在未見過的數據上的性能方面起著至關重要的作用。評估數據集與訓練數據集分開，充當現實場景的代理。它使我們能夠衡量模型將其學習推廣到新的和未見過的實例的能力。評估模型的性能對於衡量其準確性、精確度、召回率或任何其他相關指標至關重要，具體取決於特定的問題領域。

評估權重為 20%，可確保模型在未見過的數據上經過嚴格測試，並對其能力提供現實的評估。此評估階段有助於發現模型預測中的任何潛在問題，例如過度擬合、擬合不足或偏差。它還可以微調超參數和模型架構以提高性能。

為了說明這個概念，讓我們考慮一個實際的例子。假設我們正在訓練一個機器學習模型來對貓和狗的圖像進行分類。在訓練階段，模型通過分析大量標記圖像數據集來學習區分貓和狗的特徵。模型可以訓練的圖像越多，它就越能更好地區分這兩類。

訓練完成後，將使用包含以前從未見過的圖像的單獨數據集來評估模型。此評估階段測試模型概括其學習並準確分類新的、未見過的圖像的能力。通過為評估分配 20% 的權重，我們確保模型的性能能夠根據未見過的數據進行徹底評估，從而提供對其有效性的可靠衡量。

機器學習中80%的權重分配給訓練，20%的權重分配給評估，是一種戰略選擇，旨在優化學習過程，同時確保准確評估模型的性能。通過將評估過程的很大一部分用於訓練，我們優先考慮模型從數據中學習和捕獲複雜模式的能力。同時，評估階段會根據未見過的數據嚴格測試模型，對其功能進行實際評估。