在網上購物時候,不止可以透過名稱搜尋商品,也可以拍照上傳圖片搜尋商品。比如某寶上拍個圖片就能搜尋到對應的商品。
騰訊、阿里都提供了類似的影像搜尋服務,這類服務原理都差不多:
- 在一個具體的相簿上,新增或者刪除圖片。
- 透過圖片搜尋相似的圖片。
本文對接的是騰訊雲的影像搜尋。
新增配置
新增 maven 依賴:
<dependency>
<groupId>com.tencentcloudapi</groupId>
<artifactId>tencentcloud-sdk-java</artifactId>
<version>3.1.1129</version>
</dependency>
引入配置:
tencentcloud:
tiia:
secretId: ${SECRET_ID}
secretKey: ${SECRET_KEY}
endpoint: tiia.tencentcloudapi.com
region: ap-guangzhou
groupId: test1
secretId 和 secretKey 都是在 API秘鑰 地址:https://console.cloud.tencent.com/cam/capi
,groupId 是相簿 id。
配置 bean
@Data
@Configuration
@ConfigurationProperties("tencentcloud.tiia")
public class TencentCloudTiiaProperties {
private String secretId;
private String secretKey;
private String endpoint = "tiia.tencentcloudapi.com";
private String region = "ap-guangzhou";
private String groupId;
}
@Configuration
@ConditionalOnClass(TencentCloudTiiaProperties.class)
public class TencentCloudTiiaConfig {
@Bean
public TiiaClient tiiaClient(TencentCloudTiiaProperties properties) {
Credential cred = new Credential(properties.getSecretId(), properties.getSecretKey());
HttpProfile httpProfile = new HttpProfile();
httpProfile.setEndpoint(properties.getEndpoint());
ClientProfile clientProfile = new ClientProfile();
clientProfile.setHttpProfile(httpProfile);
TiiaClient client = new TiiaClient(cred, properties.getRegion(), clientProfile);
return client;
}
}
tiiaClient 是搜圖的核心,在後面新增、刪除、搜尋圖片都會使用到。
相簿更新
新建相簿之後,需要將圖片批次的匯入到相簿中。一般開始會批次將上架的圖片批次匯入到圖片庫,一般只需要操作一次。
商品有修改、新增、下架操作時,圖片也需要有對應的更新操作。但是每次都更新都同步更新操作,可能會導致資料庫頻繁更新,伺服器壓力增加,需要改成,每次更新圖片後,同步到快取中,然後定時處理快取的資料:
騰訊影像搜尋沒有影像更新介面,只有影像刪除和新增的介面,那就先呼叫刪除,再呼叫新增的介面
刪除圖片
圖片刪除呼叫 tiiaClient.DeleteImages
方法,主要注意請求頻率限制。
預設介面請求頻率限制:10次/秒
這裡就簡單處理,使用執行緒延遲處理 Thread.sleep(100)
,刪除圖片只要指定 EntityId:
@Data
public class DeleteImageDTO {
private String entityId;
private List<String> picName;
}
如果指定 PicName 就刪除 EntityId 下面的具體的圖片,如果不指定 PicName 就刪除整個 EntityId。
刪除圖片程式碼如下:
public void deleteImage(List<DeleteImageDTO> list) {
if (CollectionUtils.isEmpty(list)) {
return;
}
list.stream().forEach(deleteImageDTO -> {
List<String> picNameList = deleteImageDTO.getPicName();
if (CollectionUtils.isEmpty(picNameList)) {
DeleteImagesRequest request = new DeleteImagesRequest();
request.setGroupId(tiiaProperties.getGroupId());
request.setEntityId(deleteImageDTO.getEntityId());
try {
// 騰訊限制qps
Thread.sleep(100);
tiiaClient.DeleteImages(request);
} catch (TencentCloudSDKException | InterruptedException e) {
log.error("刪除圖片失敗, entityId {} 錯誤資訊 {}", deleteImageDTO.getEntityId(), e.getMessage());
}
} else {
picNameList.stream().forEach(picName -> {
DeleteImagesRequest request = new DeleteImagesRequest();
request.setGroupId(tiiaProperties.getGroupId());
request.setEntityId(deleteImageDTO.getEntityId());
request.setPicName(picName);
try {
Thread.sleep(100);
tiiaClient.DeleteImages(request);
} catch (TencentCloudSDKException | InterruptedException e) {
log.error("刪除圖片失敗, entityId {}, 錯誤資訊 {}", deleteImageDTO.getEntityId(), picName, e.getMessage());
}
});
}
});
}
新增圖片
新增圖片呼叫 tiiaClient.CreateImage
方法,這裡也需要注意呼叫頻率的限制。除此之外還有兩個限制:
- 限制圖片大小不可超過 5M
- 限制圖片解析度不能超過解析度不超過 4096*4096
既然壓縮圖片需要耗時,那就每次上傳圖片先壓縮一遍,這樣就能解決呼叫頻率限制的問題。壓縮圖片引入 thumbnailator:
<dependency>
<groupId>net.coobird</groupId>
<artifactId>thumbnailator</artifactId>
<version>0.4.20</version>
</dependency>
壓縮工具類:
/**
* 圖片壓縮
* @param url 圖片url
* @param scale 壓縮比例
* @param targetSizeByte 壓縮後大小 KB
* @return
*/
public static byte[] compress(String url, double scale, long targetSizeByte) {
if (StringUtils.isBlank(url)) {
return null;
}
long targetSizeKB = targetSizeByte * 1024;
try {
URL u = new URL(url);
double quality = 0.8;
ByteArrayOutputStream outputStream = new ByteArrayOutputStream(1024);
do {
Thumbnails.of(u).scale(scale) // 壓縮比例
.outputQuality(quality) // 圖片質量
.toOutputStream(outputStream);
long fileSize = outputStream.size();
if (fileSize <= targetSizeKB) {
return outputStream.toByteArray();
}
outputStream.reset();
if (quality > 0.1) {
quality -= 0.1;
} else {
scale -= 0.1;
}
} while (quality > 0 || scale > 0);
} catch (IOException e) {
log.error(e.getMessage());
}
return null;
}
透過縮小圖片尺寸和降低圖片質量將圖片壓縮到固定的大小,這裡都會先壓縮一遍。解決呼叫頻率限制的問題。
限制圖片的解析度也是使用到 thumbnailator 裡面的 size 方法。
thumbnailator 壓縮圖片和限制大小,不能一起使用,只能分來呼叫。
設定尺寸方法:
/**
* 圖片壓縮
* @param imageData
* @param width 寬度
* @param height 高度
* @return
*/
public static byte[] compressSize(byte[] imageData,String outputFormat,int width,int height) {
if (imageData == null) {
return null;
}
ByteArrayInputStream inputStream = new ByteArrayInputStream(imageData);
try {
BufferedImage bufferedImage = ImageIO.read(inputStream);
int imageWidth = bufferedImage.getWidth();
int imageHeight = bufferedImage.getHeight();
if (imageWidth <= width && imageHeight <= height) {
return imageData;
}
ByteArrayOutputStream outputStream = new ByteArrayOutputStream(1024);
Thumbnails.of(bufferedImage)
.size(width,height)
.outputFormat(outputFormat)
.toOutputStream(outputStream);
return outputStream.toByteArray();
} catch (IOException e) {
log.error(e.getMessage());
}
return null;
}
這裡的 width 和 height 並不是直接設定圖片的長度和長度,而是不會超過這個長度和寬度。如果有一個超過限制大小,壓縮尺寸,長寬比保持不變。
新增圖片需要指定 EntityId、url 以及 picName。
@Data
public class AddImageDTO {
private String entityId;
private String imgUrl;
private String picName;
}
解決了圖片壓縮問題,上傳圖片就比較簡單了:
public void uploadImage(List<AddImageDTO> list) {
if (CollectionUtils.isEmpty(list)) {
return;
}
list.stream().forEach(imageDTO -> {
String imgUrlStr = imageDTO.getImgUrl();
if (StringUtils.isBlank(imgUrlStr)) {
// 跳過當前元素
return;
}
CreateImageRequest request = new CreateImageRequest();
request.setGroupId(tiiaProperties.getGroupId());
request.setEntityId(imageDTO.getEntityId());
String imageUrl = imageDTO.getImgUrl();
// 限制大小
byte[] bytes = ImageUtils.compress(imageUrl,0.6,1024 * 5);
String imageFormat = imageUrl.substring(imageUrl.lastIndexOf(".") + 1);
// 限制解析度
bytes = ImageUtils.compressSize(bytes,imageFormat,4096,4096);
request.setImageBase64(new String(Base64.encodeBase64(bytes), StandardCharsets.UTF_8));
//JSONObject tagJson = new JSONObject();
//tagJson.put("code","搜尋欄位");
//request.setTags(JSONObject.toJSONString(tagJson));
request.setPicName(imageDTO.getPicName());
try {
tiiaClient.CreateImage(request);
} catch (TencentCloudSDKException e) {
log.error("影像上傳失敗 error:{}", e.getMessage());
}
});
}
Tags 圖片自定義標籤,設定圖片的引數,搜尋的時候就可以根據引數搜尋到不同的圖片。
更新圖片
一般商品更新,將資料存入快取中:
String value = "demo key";
SetOperations<String, Object> opsForSet = redisTemplate.opsForSet();
opsForSet.add(RedisKeyConstant.PRODUCT_IMAGE_SYNC_CACHE_KEY, value);
再定時執行任務:
public void syncImage() {
while (true) {
SetOperations<String, Object> operations = redisTemplate.opsForSet();
Object obj = operations.pop(RedisKeyConstant.PRODUCT_IMAGE_SYNC_CACHE_KEY);
if (obj == null) {
log.info("暫未發現任務資料");
return;
}
String pop = obj.toString();
if (StringUtils.isBlank(pop)) {
continue;
}
DeleteImageDTO deleteImageDTO = new DeleteImageDTO();
deleteImageDTO.setEntityId(pop);
try {
this.deleteImage(Collections.singletonList(deleteImageDTO));
} catch (Exception e) {
log.error("刪除圖片失敗,entityId {}",pop);
}
// todo 獲取資料具體的資料
String imageUrl="";
// todo picName 需要全域性唯一
String picName="";
AddImageDTO addImageDTO = new AddImageDTO();
addImageDTO.setEntityId(pop);
addImageDTO.setImgUrl(imageUrl);
addImageDTO.setPicName(picName);
try {
this.uploadImage(Collections.singletonList(addImageDTO));
} catch (Exception e) {
log.error("上傳圖片失敗,entityId {}",pop);
}
}
}
operations.pop
從集合隨機取出一個資料並移除資料,先刪除圖片,再從資料庫中查詢是否存在資料,如果存在就新增圖片。
搜尋圖片
影像搜尋呼叫 tiiaClient.SearchImage
方法,需要傳圖片位元組流,壓縮圖片需要檔案字尾。
@Data
public class SearchRequest {
private byte[] bytes;
private String suffix;
}
public ImageInfo [] analysis(SearchRequest searchRequest) throws IOException, TencentCloudSDKException {
SearchImageRequest request = new SearchImageRequest();
request.setGroupId(tiiaProperties.getGroupId());
// 篩選,對應上傳介面 Tags
//request.setFilter("channelCode=\"" + searchRequest.getChannelCode() + "\"");、
byte[] bytes = searchRequest.getBytes();
bytes = ImageUtils.compressSize(bytes,searchRequest.getSuffix(),4096,4096);
String base64 = Base64.encodeBase64String(bytes);
request.setImageBase64(base64);
SearchImageResponse searchImageResponse = tiiaClient.SearchImage(request);
return searchImageResponse.getImageInfos();
}
根據返回的 ImageInfos 陣列獲取到 EntityId,就能獲取對應的商品資訊了。
總結
對接影像搜尋,主要是做影像的更新和同步操作。相對於每次更新就同步介面,這種方式對於伺服器的壓力也比較大,先將資料同步到快取中,然後在定時的處理資料,而搜尋圖片對於資料一致性相對比較寬鬆,分散庫寫入的壓力。
新增圖片使用 thumbnailator 壓縮圖片和縮小圖片,對於呼叫請求頻率限制,新增圖片每次都會壓縮一次圖片,每次壓縮時間大概都大於 100ms,解決了請求頻率限制的問題。而刪除圖片,就簡單使用執行緒休眠的方式休眠 100ms。
做好圖片更新的操作之後,搜尋相簿使用 tiiaClient.SearchImage
方法就能獲取到對應的結果資訊了。
Github示例
https://github.com/jeremylai7/springboot-learning/blob/master/springboot-test/src/main/java/com/test/controller/ImageSearchController.java