excel表格文字識別-ocr表格文字提取api介面整合

翔云api發表於2024-10-31

  表格文字識別介面的整合示例通常包含幾個關鍵步驟,從接入API介面到最終資料處理和展示。以下是翔雲表格文字識別介面的一個基本整合流程示例:

  1. 獲取介面資訊

  在開始整合前,請確保已經獲取了表格文字識別API的介面文件,並瞭解該介面的引數需求、返回結果格式、以及鑑權方式(API Key和secret)。

  2. 傳送表格圖片至介面

  通常表格文字識別API接收圖片格式的表格檔案(如JPG、PNG等)或者PDF檔案。以下為上傳表格圖片並請求介面識別的python示例:

var client = new HttpClient();
var request = new HttpRequestMessage(HttpMethod.Post, "https://netocr.com/verapi/v2/verInvoice.do");
var content = new MultipartFormDataContent();
content.Add(new StringContent("Mg"), "key");
content.Add(new StringContent("3
6"), "secret");
content.Add(new StringContent("3007"), "typeId");
content.Add(new StringContent(""), "invoiceCode");
content.Add(new StringContent("
"), "invoiceNumber");
content.Add(new StringContent("
"), "billingDate");
content.Add(new StringContent("
"), "totalAmount");
content.Add(new StringContent("
"), "checkCode");
content.Add(new StringContent("
"), "salesTaxNo");
content.Add(new StringContent("
*********"), "orderNo");

request.Content = content;
var response = await client.SendAsync(request);
response.EnsureSuccessStatusCode();
Console.WriteLine(await response.Content.ReadAsStringAsync());

  3. 處理返回的表格資料

  介面返回的結果通常包含表格的結構化資料。常見的資料格式是JSON,其中每個單元格的內容及其位置都會被標註。

  4. 將資料儲存至表格檔案

  根據需要,可以將識別結果儲存到Excel、PDF、ofd或json格式檔案中,方便後續的資料分析或存檔。

  5. 整合測試與最佳化

  整合完成後,可以使用多種格式的表格圖片進行測試,以驗證介面識別的準確性與適配性。同時,若介面支援引數調整,可根據需求除錯,如表格方向、去除噪點等選項,提高識別效果。

  這個整合示例適合基本的表格文字識別需求。若有更復雜的要求,例如自動化批次處理、API超時處理等,可進一步新增錯誤處理和批次識別功能。

相關文章