Python呼叫百度OCR介面圖片識別轉文字

TANKING發表於2022-04-23

呼叫要求

請求圖片需經過base64編碼及urlencode後傳入:圖片的base64編碼指將一副圖片資料編碼成一串字串,使用該字串代替影像地址。您可以首先得到圖片的二進位制,然後去掉編碼頭後再進行urlencode。

介面

https://aip.baidubce.com/rest/2.0/ocr/v1/accurate_basic

程式碼

from PIL import ImageGrab
import requests
import base64

def ScreenCapture():
    # 識別圖片
    request_url = "https://aip.baidubce.com/rest/2.0/ocr/v1/accurate_basic"
    f = open('xxx.png', 'rb')
    img = base64.b64encode(f.read())
    params = {"image":img}
    access_token = '將獲取到的access_token貼上到這裡'
    request_url = request_url + "?access_token=" + access_token
    headers = {'content-type': 'application/x-www-form-urlencoded'}
    response = requests.post(request_url, data=params, headers=headers)
    if response:
        print (response.json())

# 呼叫
ScreenCapture()

使用說明

1、xxx.png是本地圖片
2、access_token = '將獲取到的access_token貼上到這裡'是需要你獲取到access_token,有效期30天,你可以快取到本地檔案,每次使用就判斷access_token是否還在有效期,如果過期就重新自動獲取並再次重新整理快取。

相關文章