Java基於百度API的圖片文字識別

Java團長_發表於2018-09-26

具體文件:

http://ai.baidu.com/docs#/OCR-API/e1bd77f3


準備工作: 

基於Java 1.8 

版本控制:maven 

使用之前需要獲取對應的專案API_KEY,SECRET_KEY,這些引數在使用API的時候必須用到,用於生成access_token。 

如何獲取這些引數:在百度開發者中心申請一個“通用文字識別”專案,然後就可以獲取到這些引數。 

準備工作都完成了,現在開始進行影像識別了。


 1. 準備pom檔案


<!-- https://mvnrepository.com/artifact/com.alibaba/fastjson -->
<dependency>
 <groupId>com.alibaba</groupId>
 <artifactId>fastjson</artifactId>
 <version>1.2.46</version>
</dependency>
<!-- https://mvnrepository.com/artifact/org.apache.httpcomponents/httpclient -->
<dependency>
 <groupId>org.apache.httpcomponents</groupId>
 <artifactId>httpclient</artifactId>
 <version>4.5.5</version>
</dependency>


2. 獲取access_token


package com.wsk.netty.check;

import org.json.JSONObject;

import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.net.HttpURLConnection;
import java.net.URL;
import java.util.List;
import java.util.Map;
/**
* 獲取token類
*
* @Author : WuShukai
* @Date :2018/2/12 10:04
*/


public class AuthService {

   /**
    * 獲取許可權token
    * @return 返回示例:
    * {
    * "access_token": "24.460da4889caad24cccdb1fea17221975.2592000.1491995545.282335-1234567",
     * "expires_in": 2592000
    * }
    */

   public static String getAuth() {
       // 官網獲取的 API Key 更新為你註冊的
       String clientId = "**";
       // 官網獲取的 Secret Key 更新為你註冊的
       String clientSecret = "**";
       return getAuth(clientId, clientSecret);
   }

   /**
    * 獲取API訪問token
    * 該token有一定的有效期,需要自行管理,當失效時需重新獲取.
    * @param ak - 百度雲官網獲取的 API Key
    * @param sk - 百度雲官網獲取的 Securet Key
    * @return assess_token 示例:
    * "24.460da4889caad24cccdb1fea17221975.2592000.1491995545.282335-1234567"
    */

   private static String getAuth(String ak, String sk) {
       // 獲取token地址
       String authHost = "https://aip.baidubce.com/oauth/2.0/token?";
       String getAccessTokenUrl = authHost
               // 1. grant_type為固定引數
               + "grant_type=client_credentials"
               // 2. 官網獲取的 API Key
               + "&client_id=" + ak
               // 3. 官網獲取的 Secret Key
               + "&client_secret=" + sk;
       try {
           URL realUrl = new URL(getAccessTokenUrl);
           // 開啟和URL之間的連線
           HttpURLConnection connection = (HttpURLConnection) realUrl.openConnection();
           connection.setRequestMethod("GET");
           connection.connect();
           // 獲取所有響應頭欄位
           Map<String, List<String>> map = connection.getHeaderFields();
           // 遍歷所有的響應頭欄位
           for (String key : map.keySet()) {
               System.err.println(key + "--->" + map.get(key));
           }
           // 定義 BufferedReader輸入流來讀取URL的響應
           BufferedReader in = new BufferedReader(new InputStreamReader(connection.getInputStream()));
            StringBuilder result = new StringBuilder();
           String line;
           while ((line = in.readLine()) != null) {
               result.append(line);
           }
           /**
            * 返回結果示例
            */

           System.err.println("result:" + result);
           JSONObject jsonObject = new JSONObject(result.toString());
           return jsonObject.getString("access_token");
       } catch (Exception e) {
           System.err.printf("獲取token失敗!");
           e.printStackTrace(System.err);
       }
       return null;
   }

   public static void main(String[] args) {
       getAuth();
   }

}


3. 編寫將圖片轉化成base64後再轉化成urlencode的工具類


package com.wsk.netty.check;

import sun.misc.BASE64Encoder;

import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStream;
import java.net.URLEncoder;

/**
* 圖片轉化base64後再UrlEncode結果
* @Author : WuShukai
* @Date :2018/2/12 10:43
*/


public class BaseImg64 {
   /**
    * 將一張本地圖片轉化成Base64字串
    * @param imgPath 本地圖片地址
    * @return 圖片轉化base64後再UrlEncode結果
    */

   public static String getImageStrFromPath(String imgPath) {
       InputStream in;
       byte[] data = null;
       // 讀取圖片位元組陣列
       try {
           in = new FileInputStream(imgPath);
           data = new byte[in.available()];
           in.read(data);
           in.close();
       } catch (IOException e) {
           e.printStackTrace();
       }
       // 對位元組陣列Base64編碼
       BASE64Encoder encoder = new BASE64Encoder();
       // 返回Base64編碼過再URLEncode的位元組陣列字串
       return URLEncoder.encode(encoder.encode(data));
   }
}


4. 編寫呼叫百度API介面的方法,獲取識別結果


package com.wsk.netty.check;

import org.apache.http.HttpResponse;
import org.apache.http.client.HttpClient;
import org.apache.http.client.methods.HttpPost;
import org.apache.http.entity.StringEntity;
import org.apache.http.impl.client.DefaultHttpClient;
import org.apache.http.util.EntityUtils;

import java.io.File;
import java.io.IOException;
import java.net.URI;
import java.net.URISyntaxException;

/**
* 影像文字識別
*
@Author : WuShukai
@Date :2018/2/12 10:25
*/


public class Check {
   private static final String POST_URL = "https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic?access_token=" + AuthService.getAuth();

   /**
    * 識別本地圖片的文字
    *
    * @param path 本地圖片地址
    * @return 識別結果,為json格式
    * @throws URISyntaxException URI開啟異常
    * @throws IOException        io流異常
    */

   public static String checkFile(String path) throws URISyntaxException, IOException {
       File file = new File(path);
       if (!file.exists()) {
           throw new NullPointerException("圖片不存在");
       }
       String image = BaseImg64.getImageStrFromPath(path);
       String param = "image=" + image;
       return post(param);
   }

   /**
    * @param url 圖片url
    * @return 識別結果,為json格式
    */

   public static String checkUrl(String url) throws IOException, URISyntaxException {
       String param = "url=" + url;
       return post(param);
   }

   /**
    * 通過傳遞引數:url和image進行文字識別
    *
    * @param param 區分是url還是image識別
    * @return 識別結果
    * @throws URISyntaxException URI開啟異常
    * @throws IOException        IO流異常
    */

   private static String post(String param) throws URISyntaxException, IOException {
       //開始搭建post請求
       HttpClient httpClient = new DefaultHttpClient();
       HttpPost post = new HttpPost();
       URI url = new URI(POST_URL);
       post.setURI(url);
       //設定請求頭,請求頭必須為application/x-www-form-urlencoded,因為是傳遞一個很長的字串,不能分段傳送
        post.setHeader("Content-Type""application/x-www-form-urlencoded");
       StringEntity entity = new StringEntity(param);
       post.setEntity(entity);
       HttpResponse response = httpClient.execute(post);
       System.out.println(response.toString());
       if (response.getStatusLine().getStatusCode() == 200) {
           String str;
           try {
               /*讀取伺服器返回過來的json字串資料*/
               str = EntityUtils.toString(response.getEntity());
               System.out.println(str);
               return str;
           } catch (Exception e) {
               e.printStackTrace();
               return null;
           }
       }
       return null;
   }

   public static void main(String[] args) {
       String path = "E:\\find.png";
       try {
           long now = System.currentTimeMillis();
           checkFile(path);
           checkUrl("https://gss3.bdstatic.com/-Po3dSag_xI4khGkpoWK1HF6hhy/baike/c0%3Dbaike80%2C5%2C5%2C80%2C26/sign=08c05c0e8444ebf8797c6c6db890bc4f/fc1f4134970a304e46bfc5f7d2c8a786c9175c19.jpg");
            System.out.println("耗時:" + (System.currentTimeMillis() - now) / 1000 + "s");
        } catch (URISyntaxException | IOException e) {
           e.printStackTrace();
       }
   }
}


5. 識別結果(僅測試本地圖片識別) 


中文


640?


結果:


640?


結論:


這裡是使用了Postman進行測試的,用IDEA控制檯的話,返回的json不易讀。 從這裡可以看出,耗時是1s,雖然識別率高,但是結果還是有那麼的一些差距,例如識別結果的第五列,只返回了“我是遜尼”,而原圖片的很大串沒有識別出來。 


英文:


640?


結果:


640?


結論:

 

單識別英文的圖片,效果還是比較滿意的,耗時短,精準率高。 


中英文結合:


640?


結果:


640?


結論:

 

結果也是比較滿意的。


Java團長

專注於Java乾貨分享

640

掃描上方二維碼獲取更多Java乾貨

相關文章