Java基於百度API的圖片文字識別
具體文件:
http://ai.baidu.com/docs#/OCR-API/e1bd77f3
準備工作:
基於Java 1.8
版本控制:maven
使用之前需要獲取對應的專案API_KEY,SECRET_KEY,這些引數在使用API的時候必須用到,用於生成access_token。
如何獲取這些引數:在百度開發者中心申請一個“通用文字識別”專案,然後就可以獲取到這些引數。
準備工作都完成了,現在開始進行影像識別了。
1. 準備pom檔案
<!-- https://mvnrepository.com/artifact/com.alibaba/fastjson -->
<dependency>
<groupId>com.alibaba</groupId>
<artifactId>fastjson</artifactId>
<version>1.2.46</version>
</dependency>
<!-- https://mvnrepository.com/artifact/org.apache.httpcomponents/httpclient -->
<dependency>
<groupId>org.apache.httpcomponents</groupId>
<artifactId>httpclient</artifactId>
<version>4.5.5</version>
</dependency>
2. 獲取access_token
package com.wsk.netty.check;
import org.json.JSONObject;
import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.net.HttpURLConnection;
import java.net.URL;
import java.util.List;
import java.util.Map;
/**
* 獲取token類
*
* @Author : WuShukai
* @Date :2018/2/12 10:04
*/
public class AuthService {
/**
* 獲取許可權token
* @return 返回示例:
* {
* "access_token": "24.460da4889caad24cccdb1fea17221975.2592000.1491995545.282335-1234567",
* "expires_in": 2592000
* }
*/
public static String getAuth() {
// 官網獲取的 API Key 更新為你註冊的
String clientId = "**";
// 官網獲取的 Secret Key 更新為你註冊的
String clientSecret = "**";
return getAuth(clientId, clientSecret);
}
/**
* 獲取API訪問token
* 該token有一定的有效期,需要自行管理,當失效時需重新獲取.
* @param ak - 百度雲官網獲取的 API Key
* @param sk - 百度雲官網獲取的 Securet Key
* @return assess_token 示例:
* "24.460da4889caad24cccdb1fea17221975.2592000.1491995545.282335-1234567"
*/
private static String getAuth(String ak, String sk) {
// 獲取token地址
String authHost = "https://aip.baidubce.com/oauth/2.0/token?";
String getAccessTokenUrl = authHost
// 1. grant_type為固定引數
+ "grant_type=client_credentials"
// 2. 官網獲取的 API Key
+ "&client_id=" + ak
// 3. 官網獲取的 Secret Key
+ "&client_secret=" + sk;
try {
URL realUrl = new URL(getAccessTokenUrl);
// 開啟和URL之間的連線
HttpURLConnection connection = (HttpURLConnection) realUrl.openConnection();
connection.setRequestMethod("GET");
connection.connect();
// 獲取所有響應頭欄位
Map<String, List<String>> map = connection.getHeaderFields();
// 遍歷所有的響應頭欄位
for (String key : map.keySet()) {
System.err.println(key + "--->" + map.get(key));
}
// 定義 BufferedReader輸入流來讀取URL的響應
BufferedReader in = new BufferedReader(new InputStreamReader(connection.getInputStream()));
StringBuilder result = new StringBuilder();
String line;
while ((line = in.readLine()) != null) {
result.append(line);
}
/**
* 返回結果示例
*/
System.err.println("result:" + result);
JSONObject jsonObject = new JSONObject(result.toString());
return jsonObject.getString("access_token");
} catch (Exception e) {
System.err.printf("獲取token失敗!");
e.printStackTrace(System.err);
}
return null;
}
public static void main(String[] args) {
getAuth();
}
}
3. 編寫將圖片轉化成base64後再轉化成urlencode的工具類
package com.wsk.netty.check;
import sun.misc.BASE64Encoder;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStream;
import java.net.URLEncoder;
/**
* 圖片轉化base64後再UrlEncode結果
* @Author : WuShukai
* @Date :2018/2/12 10:43
*/
public class BaseImg64 {
/**
* 將一張本地圖片轉化成Base64字串
* @param imgPath 本地圖片地址
* @return 圖片轉化base64後再UrlEncode結果
*/
public static String getImageStrFromPath(String imgPath) {
InputStream in;
byte[] data = null;
// 讀取圖片位元組陣列
try {
in = new FileInputStream(imgPath);
data = new byte[in.available()];
in.read(data);
in.close();
} catch (IOException e) {
e.printStackTrace();
}
// 對位元組陣列Base64編碼
BASE64Encoder encoder = new BASE64Encoder();
// 返回Base64編碼過再URLEncode的位元組陣列字串
return URLEncoder.encode(encoder.encode(data));
}
}
4. 編寫呼叫百度API介面的方法,獲取識別結果
package com.wsk.netty.check;
import org.apache.http.HttpResponse;
import org.apache.http.client.HttpClient;
import org.apache.http.client.methods.HttpPost;
import org.apache.http.entity.StringEntity;
import org.apache.http.impl.client.DefaultHttpClient;
import org.apache.http.util.EntityUtils;
import java.io.File;
import java.io.IOException;
import java.net.URI;
import java.net.URISyntaxException;
/**
* 影像文字識別
*
* @Author : WuShukai
* @Date :2018/2/12 10:25
*/
public class Check {
private static final String POST_URL = "https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic?access_token=" + AuthService.getAuth();
/**
* 識別本地圖片的文字
*
* @param path 本地圖片地址
* @return 識別結果,為json格式
* @throws URISyntaxException URI開啟異常
* @throws IOException io流異常
*/
public static String checkFile(String path) throws URISyntaxException, IOException {
File file = new File(path);
if (!file.exists()) {
throw new NullPointerException("圖片不存在");
}
String image = BaseImg64.getImageStrFromPath(path);
String param = "image=" + image;
return post(param);
}
/**
* @param url 圖片url
* @return 識別結果,為json格式
*/
public static String checkUrl(String url) throws IOException, URISyntaxException {
String param = "url=" + url;
return post(param);
}
/**
* 通過傳遞引數:url和image進行文字識別
*
* @param param 區分是url還是image識別
* @return 識別結果
* @throws URISyntaxException URI開啟異常
* @throws IOException IO流異常
*/
private static String post(String param) throws URISyntaxException, IOException {
//開始搭建post請求
HttpClient httpClient = new DefaultHttpClient();
HttpPost post = new HttpPost();
URI url = new URI(POST_URL);
post.setURI(url);
//設定請求頭,請求頭必須為application/x-www-form-urlencoded,因為是傳遞一個很長的字串,不能分段傳送
post.setHeader("Content-Type", "application/x-www-form-urlencoded");
StringEntity entity = new StringEntity(param);
post.setEntity(entity);
HttpResponse response = httpClient.execute(post);
System.out.println(response.toString());
if (response.getStatusLine().getStatusCode() == 200) {
String str;
try {
/*讀取伺服器返回過來的json字串資料*/
str = EntityUtils.toString(response.getEntity());
System.out.println(str);
return str;
} catch (Exception e) {
e.printStackTrace();
return null;
}
}
return null;
}
public static void main(String[] args) {
String path = "E:\\find.png";
try {
long now = System.currentTimeMillis();
checkFile(path);
checkUrl("https://gss3.bdstatic.com/-Po3dSag_xI4khGkpoWK1HF6hhy/baike/c0%3Dbaike80%2C5%2C5%2C80%2C26/sign=08c05c0e8444ebf8797c6c6db890bc4f/fc1f4134970a304e46bfc5f7d2c8a786c9175c19.jpg");
System.out.println("耗時:" + (System.currentTimeMillis() - now) / 1000 + "s");
} catch (URISyntaxException | IOException e) {
e.printStackTrace();
}
}
}
5. 識別結果(僅測試本地圖片識別)
中文
結果:
結論:
這裡是使用了Postman進行測試的,用IDEA控制檯的話,返回的json不易讀。 從這裡可以看出,耗時是1s,雖然識別率高,但是結果還是有那麼的一些差距,例如識別結果的第五列,只返回了“我是遜尼”,而原圖片的很大串沒有識別出來。
英文:
結果:
結論:
單識別英文的圖片,效果還是比較滿意的,耗時短,精準率高。
中英文結合:
結果:
結論:
結果也是比較滿意的。
Java團長
專注於Java乾貨分享
掃描上方二維碼獲取更多Java乾貨
相關文章
- Python3呼叫百度OCR圖片文字識別APIPythonAPI
- 利用百度AI OCR圖片識別,Java實現PDF中的圖片轉換成文字AIJava
- paddleocr圖片文字識別
- 從圖片提取文字的終極解決方法 ——【通用文字識別 API】API
- 圖片裁剪-文字識別-文字新增
- Python呼叫百度OCR介面圖片識別轉文字Python
- 如何免費識別圖片文字?圖片文字識別軟體怎麼用
- Java 實現OCR掃描/識別圖片文字Java
- Java如何使用Tessdata做OCR圖片文字識別Java
- Tesseract OCR 圖片文字識別
- 分享:識別圖片文字方法
- 圖片文字識別工具怎樣進行批次識別圖片?
- 如何將圖片識別成文字?
- 圖片識別文字具體操作
- 圖片識別文字,分享給你!
- 基於python的文字轉圖片工具Python
- 哪個圖片識別文字app能快速轉換圖片成文字?APP
- 使用Tesseract進行圖片文字識別
- 圖片文字識別怎麼實現
- 實現圖片文字識別的方法有哪些
- C# 10分鐘完成百度圖片提取文字(文字識別)——入門篇C#
- 識別圖片文字轉換成word文字真的很難嗎?分享圖片轉文字的技巧
- 有道自然語言翻譯和文字識別OCR(圖片文字識別)介面呼叫
- java 百度手寫文字識別介面配置Java
- 通用文字識別API-通用文字識別介面可以識別哪些場景文字API
- OCR圖片文字識別軟體:Initiater Pro for MacMac
- 如何輕鬆識別圖片文字?請看教程
- 基於百度雲的OCR識別(Python)Python
- 基於 Kotlin Native 的基本文字識別程式Kotlin
- Java也能做OCR!SpringBoot 整合 Tess4J 實現圖片文字識別JavaSpring Boot
- 手寫的文字圖片怎樣使用OCR軟體識別?
- 儲存圖片文字的好幫手——雲脈文件識別
- JavaScript圖片文字識別(OCR)外掛Ocrad.js教程JavaScriptJS
- Tesseract 圖片識別
- java指紋識別以及谷歌圖片識別技術原始碼Java谷歌原始碼
- CSS 基於文字的圖片馬賽克你見過嗎CSS
- Java 讀取Word文字框中的文字/圖片/表格Java
- ?白piao?iText 1.7.4 中文版 (OCR圖片文字識別工具)