使用CMLE(雲端機器學習引擎)建立版本時,需要指定匯出模型的來源。 此要求很重要,原因有幾個,本答案將對此進行詳細解釋。
首先,我們來了解一下什麼是「導出模型」。 在 CMLE 情境中,匯出模型是指以可用於預測的格式儲存或匯出的經過訓練的機器學習模型。 此匯出的模型可以以各種格式存儲,例如 TensorFlow SavedModel、TensorFlow Lite,甚至自訂格式。
那麼,為什麼在 CMLE 中建立版本時需要指定導出模型的來源呢? 原因在於 CMLE 的工作流程以及需要提供服務模式所需的資源。 建立版本時,CMLE 需要知道導出的模型位於何處,以便可以部署它並可用於預測。
透過指定導出模型的來源,CMLE 可以有效地檢索模型並將其載入到服務基礎架構中。 這使得模型能夠為客戶的預測請求做好準備。 如果不指定來源,CMLE 將不知道在哪裡可以找到模型,並且無法提供預測。
此外,指定導出模型的來源使 CMLE 能夠有效地處理版本控制。 在機器學習中,通常會對模型進行訓練和迭代,並隨著時間的推移進行改進。 CMLE 可讓您建立模型的多個版本,每個版本代表不同的迭代或改進。 透過指定導出模型的來源,CMLE 可以追蹤這些版本並確保為每個預測請求提供正確的模型。
為了說明這一點,請考慮一個場景:機器學習工程師使用 TensorFlow 訓練模型並將其匯出為 SavedModel。 然後,工程師使用 CMLE 建立模型的版本,並將來源指定為匯出的 SavedModel 檔案。 CMLE 部署模型並使其可用於預測。 現在,如果工程師稍後訓練模型的改進版本並將其匯出為新的 SavedModel,他們可以在 CMLE 中建立另一個版本,並將新匯出的模型指定為來源。 這使得 CMLE 能夠單獨管理兩個版本,並根據預測請求中指定的版本提供適當的模型。
使用 CMLE 建立版本時,需要指定導出模型的來源,以提供服務模型所需的資源、實作模型的高效檢索和載入以及支援模型的版本控制。
最近的其他問題和解答 機器學習的發展:
- 是否可以使用 Kaggle 上傳財務資料並使用 R-squared、ARIMA 或 GARCH 等計量經濟模型進行統計分析和預測?
- 當一個核心被資料分叉並且原始核心是私有的時,分叉的核心可以公開嗎?
- 在機器學習中處理大型資料集有哪些限制?
- 機器學習可以提供一些對話幫助嗎?
- 什麼是 TensorFlow 遊樂場?
- Eager 模式會妨礙 TensorFlow 的分散式運算功能嗎?
- 谷歌雲端解決方案能否用於將運算與儲存解耦,以便更有效地利用大數據訓練機器學習模型?
- Google Cloud Machine Learning Engine (CMLE) 是否提供自動資源取得和配置,並在模型訓練完成後處理資源關閉?
- 是否可以在任意大的資料集上毫無問題地訓練機器學習模型?
- CMLE 能否從 Google Cloud 儲存資料中讀取並使用指定的訓練模型進行推理?
更多問題及解答:
- 領域: 人工智能 (AI)
- 程序: EITC/AI/GCML Google雲機器學習 (前往認證計劃)
- 課: 機器學習的發展 (去相關課程)
- 主題: GCP BigQuery和開放數據集 (轉到相關主題)