相似圖片搜尋的原理（二）

阮一峰發表於2013-03-31

二年前，我寫了《相似圖片搜尋的原理》，介紹了一種最簡單的實現方法。

昨天，我在isnowfy的網站看到，還有其他兩種方法也很簡單，這裡做一些筆記。

相似圖片搜尋的原理（二）

一、顏色分佈法

每張圖片都可以生成顏色分佈的直方圖（color histogram）。如果兩張圖片的直方圖很接近，就可以認為它們很相似。

相似圖片搜尋的原理（二）

任何一種顏色都是由紅綠藍三原色（RGB）構成的，所以上圖共有4張直方圖（三原色直方圖 + 最後合成的直方圖）。

如果每種原色都可以取256個值，那麼整個顏色空間共有1600萬種顏色（256的三次方）。針對這1600萬種顏色比較直方圖，計算量實在太大了，因此需要採用簡化方法。可以將0～255分成四個區：0～63為第0區，64～127為第1區，128～191為第2區，192～255為第3區。這意味著紅綠藍分別有4個區，總共可以構成64種組合（4的3次方）。

任何一種顏色必然屬於這64種組合中的一種，這樣就可以統計每一種組合包含的畫素數量。

相似圖片搜尋的原理（二）

上圖是某張圖片的顏色分佈表，將表中最後一欄提取出來，組成一個64維向量(7414, 230, 0, 0, 8, ..., 109, 0, 0, 3415, 53929)。這個向量就是這張圖片的特徵值或者叫"指紋"。

於是，尋找相似圖片就變成了找出與其最相似的向量。這可以用皮爾遜相關係數或者餘弦相似度算出。

二、內容特徵法

除了顏色構成，還可以從比較圖片內容的相似性入手。

首先，將原圖轉成一張較小的灰度圖片，假定為50x50畫素。然後，確定一個閾值，將灰度圖片轉成黑白圖片。

相似圖片搜尋的原理（二）

如果兩張圖片很相似，它們的黑白輪廓應該是相近的。於是，問題就變成了，第一步如何確定一個合理的閾值，正確呈現照片中的輪廓？

顯然，前景色與背景色反差越大，輪廓就越明顯。這意味著，如果我們找到一個值，可以使得前景色和背景色各自的"類內差異最小"（minimizing the intra-class variance），或者"類間差異最大"（maximizing the inter-class variance），那麼這個值就是理想的閾值。

1979年，日本學者大津展之證明了，"類內差異最小"與"類間差異最大"是同一件事，即對應同一個閾值。他提出一種簡單的演算法，可以求出這個閾值，這被稱為"大津法"（Otsu's method）。下面就是他的計算方法。

假定一張圖片共有n個畫素，其中灰度值小於閾值的畫素為 n1 個，大於等於閾值的畫素為 n2 個（ n1 + n2 = n ）。w1 和 w2 表示這兩種畫素各自的比重。

　　w1 = n1 / n

　　w2 = n2 / n

再假定，所有灰度值小於閾值的畫素的平均值和方差分別為 μ1 和 σ1，所有灰度值大於等於閾值的畫素的平均值和方差分別為 μ2 和 σ2。於是，可以得到

　　類內差異 = w1(σ1的平方) + w2(σ2的平方)

　　類間差異 = w1w2(μ1-μ2)^2

可以證明，這兩個式子是等價的：得到"類內差異"的最小值，等同於得到"類間差異"的最大值。不過，從計算難度看，後者的計算要容易一些。

下一步用"窮舉法"，將閾值從灰度的最低值到最高值，依次取一遍，分別代入上面的算式。使得"類內差異最小"或"類間差異最大"的那個值，就是最終的閾值。具體的例項和Java演算法，請看這裡。

相似圖片搜尋的原理（二）

有了50x50畫素的黑白縮圖，就等於有了一個50x50的0-1矩陣。矩陣的每個值對應原圖的一個畫素，0表示黑色，1表示白色。這個矩陣就是一張圖片的特徵矩陣。

兩個特徵矩陣的不同之處越少，就代表兩張圖片越相似。這可以用"異或運算"實現（即兩個值之中只有一個為1，則運算結果為1，否則運算結果為0）。對不同圖片的特徵矩陣進行"異或運算"，結果中的1越少，就是越相似的圖片。

（完）

相似圖片搜尋的原理
2011-07-21
Google 按圖搜尋的原理
2013-03-23
Go
淘寶拍立淘介面，圖片搜尋介面，圖片識別介面，以圖搜貨介面，按圖搜尋介面程式碼教程
2023-04-09
利用python進行識別相似圖片(二)
2016-02-27
Python
搜尋引擎-03-搜尋引擎原理
2024-04-04
以圖搜圖三大搜尋引擎：Google圖片、TinEye、百度識圖
2012-05-30
Go
Python爬蟲搜尋並下載圖片
2017-12-13
Python爬蟲
解鎖1688圖片搜尋API介面：一鍵獲取相似商品，開啟智慧視覺新篇章
2024-02-05
API視覺
用一個圖書庫例項搞懂二分搜尋樹的底層原理
2020-06-23
搜尋引擎原理及使用
2017-03-03
midjourney 生成相似型別圖片
2024-07-22
型別
【搜尋引擎】 PostgreSQL 10 實時全文檢索和分詞、相似搜尋、模糊匹配實現類似Google搜尋自動提示
2019-07-11
SQL分詞Go
深度解析搜尋引擎的原理結構
2015-05-14
python sift 特徵匹配圖片相似度
2020-12-30
Python特徵
老司機帶你檢測相似圖片
2017-10-18
圖片相似度對比SSIM和PHash
2024-08-20
二叉搜尋樹
2024-11-21
1688圖片搜尋介面，拍立淘介面程式碼展示
2023-03-01
Android MVP+LoaderManager+CursorLoader實現圖片搜尋
2018-01-11
AndroidMVP
以圖搜尋——網際網路影象搜尋引擎的“雞肋”？
2013-04-25
Facebook AI 相似性搜尋 (Faiss)快速上手手冊 - pinecone
2021-11-22
AI
搜尋引擎工作的基礎流程與原理
2012-11-05
Elasticsearch 近實時搜尋的底層原理
2024-06-17
Elasticsearch
240. 搜尋二維矩陣 II 和74. 搜尋二維矩陣
2020-11-15
矩陣
Leetcode 700. 二叉搜尋樹中的搜尋（DAY 2）
2020-12-20
LeetCode
Qt實現圖片拖拽上傳過濾資料夾內圖片自動搜尋列表展示
2024-07-24
QT
二分搜尋樹元素的插入
2021-03-30
二叉搜尋樹的操作集
2018-08-04
二叉搜尋樹的結構
2024-10-20
搜尋Idiot就出現川普圖片，演算法無罪！
2018-12-13
演算法
"淘寶拍立淘圖片搜尋介面：輕鬆找到同款商品！"
2023-10-10
淘寶拍立淘圖片搜尋介面：輕鬆找到同款商品！
2024-01-16
資料結構高階--二叉搜尋樹（原理+實現）
2022-12-01
資料結構
06 二分搜尋--ing
2024-06-06
谷歌數月內推移動搜尋索引 PC搜尋退居二線
2016-10-15
谷歌索引
Python之常用查詢演算法：最小項搜尋、順序搜尋、二分搜尋
2019-09-30
Python演算法
二分搜尋之搜尋陣列中目標元素的首尾下標
2018-10-15
陣列
leetcode 700. 二叉搜尋樹中的搜尋思考分析
2020-10-24
LeetCode

相似圖片搜尋的原理（二）

相關文章