要使用 Google Vision API 存取從圖像中提取的文本,您可以執行一系列涉及利用 API 的光學字元辨識 (OCR) 功能的步驟。 Google Vision API 中的 OCR 技術可以偵測和提取圖像中的文本,包括手寫內容。此功能在需要分析和理解視覺數據中存在的文字資訊的應用程式中特別有用。
首先,您需要設定必要的環境來使用 Google Vision API。這涉及在 Google Cloud Console 中建立專案、啟用 Vision API 以及取得所需的身份驗證憑證,例如 API 金鑰或服務帳戶金鑰。
設定環境後,您可以使用 Vision API 的「asyncBatchAnnotateFiles」方法對映像檔執行 OCR。此方法可讓您傳遞影像檔案清單進行處理並非同步接收結果。或者,您可以使用“asyncBatchAnnotateImages”方法直接處理圖像清單。
要從圖像中提取文本,您需要建立“AnnotateImageRequest”物件的實例並指定所需的功能。在這種情況下,您可以設定“TEXT_DETECTION”功能來指示您要從圖像中提取文字。您也可以指定其他參數(例如語言提示)以提高 OCR 的準確性。
接下來,您需要將圖像檔案編碼為 Base64 編碼的字串,並使用編碼的圖像資料建立「Image」物件的實例。該“Image”物件應新增至先前建立的“AnnotateImageRequest”物件中。
設定請求後,您可以使用「batchAnnotateImages」或「batchAnnotateFiles」方法將其傳送至 Vision API,具體取決於您選擇的方法。 API 將處理圖像並傳回包含提取的文字的回應。
若要存取從回應中提取的文本,您可以迭代「AnnotateImageResponse」物件的「textAnnotations」欄位。此欄位包含「EntityAnnotation」物件的列表,每個物件代表影像中偵測到的文字元素。每個“EntityAnnotation”物件的“description”欄位包含提取的文字。
以下是 Python 中的範例程式碼片段,示範如何使用 Google Vision API 存取從圖像中提取的文字:
python from google.cloud import vision def extract_text_from_image(image_path): client = vision.ImageAnnotatorClient() with open(image_path, 'rb') as image_file: content = image_file.read() image = vision.Image(content=content) request = vision.AnnotateImageRequest( image=image, features=[{'type': vision.Feature.Type.TEXT_DETECTION}] ) response = client.batch_annotate_images(requests=[request]) for annotation in response.responses[0].text_annotations: extracted_text = annotation.description print(extracted_text) # Usage extract_text_from_image('path_to_image.jpg')
在此範例中,「extract_text_from_image」函數將映像檔的路徑作為輸入,並使用 Google Cloud Vision 用戶端庫向 Vision API 發送請求。然後列印出提取的文字。
要使用 Google Vision API 存取從圖像中提取的文本,您需要設定環境,創建具有所需功能的“AnnotateImageRequest”對象,對圖像文件進行編碼,將請求發送到 API,然後檢索提取的文本從響應中。 Vision API 的 OCR 功能可以從圖像中偵測和提取文本,包括手寫體。
最近的其他問題和解答 檢測和提取手寫文字:
- 使用 Google Vision API 從複雜文件中提取文字時可能會出現哪些限制?
- Google Vision API 文字解釋中的置信度有何意義?
- Google Vision API 如何準確識別並提取手寫筆記中的文字?
- 從手寫圖像中檢測和提取文字面臨哪些挑戰?
- Google Vision 可以辨識手寫體嗎?
更多問題及解答:
- 領域: 人工智能
- 程序: EITC/AI/GVAPI Google Vision API (前往認證計劃)
- 課: 了解視覺數據中的文字 (去相關課程)
- 主題: 檢測和提取手寫文字 (轉到相關主題)
- 考試複習