若要使用 Python 和 Vision API 以程式設計方式從圖像中提取標籤,您可以利用 Google Cloud Vision API 的強大功能。 Vision API 提供了一套全面的圖像分析功能,包括標籤檢測,可讓您自動識別並從圖像中提取標籤。
首先,您需要設定一個 Google Cloud 專案並啟用 Vision API。完成此操作後,您可以透過執行以下命令來安裝所需的 Python 庫:
python pip install google-cloud-vision
接下來,您需要對應用程式進行身份驗證才能存取 Vision API。您可以透過建立服務帳戶金鑰並將「GOOGLE_APPLICATION_CREDENTIALS」環境變數設定為指向金鑰檔案的路徑來完成此操作。這可以使用以下程式碼來完成:
python import os from google.cloud import vision os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = '/path/to/service_account_key.json'
現在,您可以使用 Vision API 以程式設計方式從圖像中提取標籤。以下程式碼片段示範如何執行此操作:
python def extract_labels(image_path): client = vision.ImageAnnotatorClient() with open(image_path, 'rb') as image_file: content = image_file.read() image = vision.Image(content=content) response = client.label_detection(image=image) labels = response.label_annotations extracted_labels = [label.description for label in labels] return extracted_labels
在這個程式碼中,我們首先從「google.cloud.vision」庫建立「ImageAnnotatorClient」類別的實例。然後,我們讀取圖像文件,從文件內容創建一個“Image”對象,並將其發送到 Vision API 進行標籤檢測。 API 回應包含標籤註釋列表,我們可以從中提取標籤的描述。
現在,您可以透過傳遞要分析的映像檔的路徑來呼叫「extract_labels」函數。它將返回從圖像中提取的標籤列表。
python image_path = '/path/to/image.jpg' labels = extract_labels(image_path) print(labels)
這將從圖像中輸出提取的標籤。
plaintext ['cat', 'animal', 'whiskers', 'small to medium-sized cats', 'mammal']
Vision API 使用先進的機器學習模型來分析影像並識別物件、場景和其他視覺特徵。它可以準確地檢測各種標籤,使其成為圖像分類、內容審核和視覺搜尋等各種應用的寶貴工具。
要使用Python 和Vision API 以程式設計方式從圖像中提取標籤,您需要設定一個Google Cloud 項目,啟用Vision API,安裝所需的Python 庫,對您的應用程式進行身份驗證,然後使用Vision API 對圖像執行標籤檢測。圖片。擷取的標籤可用於進一步分析或增強對影像內容的理解。
最近的其他問題和解答 EITC/AI/GVAPI Google Vision API:
- Google Vision API 是否可以應用於使用 Pillow Python 庫在影片而不是影像中偵測和標記物件?
- 如何實現在圖像和影片中繪製動物周圍的物件邊框並用特定的動物名稱標記這些邊框?
- Google Vision API 中的物件辨識有哪些預先定義類別?
- Google Vision API 是否支援臉部辨識?
- 使用“draw_vertices”函數繪製物件邊框時如何將顯示文字新增至影像?
- 提供的程式碼中「draw.line」方法的參數是什麼,以及如何使用它們在頂點值之間繪製線條?
- 如何使用pillow函式庫在Python中繪製物件邊框?
- 提供的程式碼中「draw_vertices」函數的用途是什麼?
- Google Vision API 如何協助理解影像中的形狀和物件?
- 使用者如何探索 API 推薦的視覺上相似的圖像?
查看 EITC/AI/GVAPI Google Vision API 中的更多問題與答案