要從人工智慧領域的 API 回應中提取所有物件註釋 - Google Vision API - 進階影像理解 - 物件偵測,您可以利用 API 提供的回應格式,其中包括偵測到的物件的清單及其對應的物件邊界框和置信度分數。透過解析此回應,您可以提取所需的物件註釋。
API 回應通常由包含各種欄位的 JSON 物件組成,其中包括包含偵測到的物件的「localizedObjectAnnotations」欄位。每個物件註釋都包含物件名稱、邊界框座標以及表示 API 在偵測中的置信度的置信度分數等資訊。
若要提取物件註釋,您可以按照以下步驟操作:
1. 解析 API 回應:首先解析從 API 接收的 JSON 回應。這可以使用 JSON 解析函式庫或程式語言提供的內建函數來完成。
2. 存取「localizedObjectAnnotations」欄位:解析回應後,存取「localizedObjectAnnotations」字段,其中包含偵測到的物件。此欄位通常是物件註解的陣列。
3. 迭代物件註解:迭代數組中的每個物件註釋。每個註釋代表影像中偵測到的物件。
4. 提取相關資訊:從每個物件註釋中提取相關訊息,例如物件的名稱、邊界框座標和置信度得分。這些詳細資訊可以作為每個物件註釋中的單獨欄位進行存取。
5. 儲存或處理提取的資訊:根據您的要求,您可以將提取的資訊儲存在資料結構中或進一步處理以進行分析或其他目的。例如,您可能希望將物件名稱及其對應的邊界框座標儲存在資料庫中或將它們用於進一步的圖像理解任務。
下面是一個簡化的範例來說明提取過程:
python import json # Assume 'response' contains the API response in JSON format response =
{
“localizedObjectAnnotations”:[
{
“中”:“/m/01g317”,
“名字”:“貓”,
“分數”:0.89271355,
「邊界多邊形」:{
“標準化頂點”:[
{“x”:0.1234,“y”:0.5678},
{“x”:0.5678,“y”:0.1234}
] }
},
{
“中”:“/m/04rky”,
“名字”:“狗”,
“分數”:0.8132468,
「邊界多邊形」:{
“標準化頂點”:[
{“x”:0.4321,“y”:0.8765},
{“x”:0.8765,“y”:0.4321}
] }
}
] }
# Parse the API response response_data = json.loads(response) # Access the object annotations annotations = response_data['localizedObjectAnnotations'] # Iterate through the object annotations for annotation in annotations: # Extract relevant information object_name = annotation['name'] bounding_box = annotation['boundingPoly']['normalizedVertices'] confidence = annotation['score'] # Process or store the extracted information print(f"Object: {object_name}, Bounding Box: {bounding_box}, Confidence: {confidence}") # Output: # Object: cat, Bounding Box: [{'x': 0.1234, 'y': 0.5678}, {'x': 0.5678, 'y': 0.1234}], Confidence: 0.89271355 # Object: dog, Bounding Box: [{'x': 0.4321, 'y': 0.8765}, {'x': 0.8765, 'y': 0.4321}], Confidence: 0.8132468
在此範例中,我們假設 JSON 回應包含兩個偵測到的物件:一隻貓和一隻狗。程式碼解析回應,存取「localizedObjectAnnotations」字段,迭代每個物件註釋,並提取物件的名稱、邊界框座標和置信度得分。最後,列印提取的信息,但您可以修改程式碼以滿足您的特定需求。
透過執行以下步驟,您可以有效地從人工智慧領域的 API 回應中提取所有物件註釋 - Google Vision API - 進階影像理解 - 物件偵測。
最近的其他問題和解答 高級圖像理解:
- Google Vision API 中的物件辨識有哪些預先定義類別?
- 將安全搜尋偵測功能與其他審核技術結合使用的建議方法是什麼?
- 我們如何存取並顯示安全搜尋註釋中每個類別的似然值?
- 我們如何在Python中使用Google Vision API獲得安全的搜尋註解?
- 安全搜尋偵測功能包含哪五個類別?
- Google Vision API 的安全搜尋功能如何偵測影像中的露骨內容?
- 我們如何使用枕頭庫直觀地識別並突出顯示圖像中檢測到的對象?
- 我們如何使用 pandas 資料框以表格格式組織提取的物件資訊?
- 使用哪些函式庫和程式語言來示範 Google Vision API 的功能?
- Google Vision API 如何執行影像中的物件偵測和定位?