關於DPM(Deformable Part Model)演算法中模型視覺化的解釋

masikkk發表於2014-05-16

原文網址 : https://blog.csdn.net/masibuaa/article/details/25990309

DPM原始碼(voc-release)中的模型視覺化做的還算相當炫酷的，可以讓我們直觀的看到訓練好的模型，甚至我們不用去做模型的評價，直接根據肉眼的觀察，就能大致瞭解一個目標訓練的好不好，比如我訓練一個人體模型，那他的視覺化圖當然就是越接近人體越好。

下面是對DPM原始碼中有關模型視覺化部分程式碼的分析，通過分析這些程式碼，有助於更好的理解DPM模型。

注意：我的原始碼版本是voc-release3.1，第4版往後的模型變得更復雜，這裡不討論。

有關模型視覺化的程式碼主要在visualizemodel.m，foldHOG.m和HOGpicture.m中。

（1）簡化分類器引數向量(或者叫濾波器權重向量)

DPM中使用降維後的31維HOG特徵向量，所以，與之對應的，訓練好的模型的引數向量也是31維的，為了方便視覺化，需要將31維的引數向量簡化為9維，foldHOG函式就負責引數向量的簡化。

31維的HOG特徵向量是有分段含義的，如下：

設C是聚合有9個對比度不敏感方向的畫素級特徵對映而獲得的基於cell的特徵對映，D是聚合有18個對比度敏感方向的畫素級特徵而獲得的基於cell的特徵對映。用4種不同的歸一化方法對C(i,j)和D(i,j)進行歸一化和截斷(限幅)，可以獲得一個4*(9+18)=108維的特徵向量F(i,j)。實際中我們使用此108維向量的一個解析投影，此投影由下面幾個統計量定義：27個在不同歸一化因子上的累加和(即列的和)，F中的每個方向通道對應一個；以及4個在不同方向(9維對比度不敏感方向)上的累加和(即行的和)，每個歸一化因子對應一個。cell尺寸k=8，截斷(限幅)閾值α=0.2。最終的特徵對映是31維向量G(i,j)，其中27維對應不同的方向通道(9個對比度不敏感方向和18個對比度敏感方向)，剩下4維表示(i,j)周圍4個cell組成的block的梯度能量。

所以，foldHOG中的簡化過程就是將31維引數向量的後4維丟棄，將前27維進行負值抑制和摺疊累加，縮減為9維的引數向量。

foldHOG函式原始碼註釋如下：

function f = foldHOG(w)
% 簡化濾波器向量w，用以視覺化顯示模型
% 將 width*height*31 的濾波器引數向量w濃縮為 width*height*9 的向量(width和height是濾波器的寬度和高度)
% 返回值f是一個width*height*9的矩陣
%
% f = foldHOG(w)
% Condense HOG features into one orientation histogram.
% Used for displaying a feature.


% max(w(:,:,1:9),0)返回w(:,:,1:9)中元素和0兩者中的較大值(去除負權重)，返回結果組成一個width*height*9維的矩陣
% 所以下面的處理相當於把濾波器引數向量w沿第三維維摺疊了兩次，形成一個了一個width*height*9的簡化版的引數向量
% w的第三維的長度為31，只使用了前27個值，捨棄了後面4個值，這和DPM中使用的31維HOG特徵向量所代表的意義有關。
% DPM中的特徵向量為31維，其中前27維對應不同的方向通道(9個對比度不敏感方向和18個對比度敏感方向)，
% 剩下4維表示(i,j)周圍4個cell組成的block的梯度能量。
f = max(w(:,:,1:9),0) + max(w(:,:,10:18),0) + max(w(:,:,19:27),0);

（2）生成濾波器權重向量的視覺化圖

這一工作在HOGpicture函式中完成，此函式負責為簡化後的w*h*9維的權重向量生成視覺化圖。

首先要生成一個間隔為20度的方向座標基，然後將濾波器向量中的點(i,j,k)向座標基中的方向k上投影，而用該點的值衡量(i,j)在k方向的幅度。

HOGpicture函式原始碼註釋如下：

function im = HOGpicture(w, bs)
% 畫出HOG正權重w的條紋影象 
% 引數：
% w：簡化後的width*height*9的HOG正權重向量(width和height是濾波器的寬度和高度)
% bs：生成的影象im相比於濾波器尺寸的擴大倍數
% 返回值：
% im：濾波器權重向量的視覺化圖，是大小為(width*bs)*(height*bs)的影象
%
% HOGpicture(w, bs)
% Make picture of positive HOG weights.

% 為間隔20度的9個方向生成條紋線
% 其實bim相當於有9個方向的方向空間的一個座標基，將濾波器向量中某點的值w(i,j,:)向bim的各個方向投影可以反映每個點的方向分佈
% construct a "glyph" for each orientaion
bim1 = zeros(bs, bs); % 生成一個bs*bs的全零矩陣bim1
bim1(:,round(bs/2):round(bs/2)+1) = 1; % 將bim1的中間兩個豎條的值置為1
bim = zeros([size(bim1) 9]); % 生成一個bs*bs*9的全零矩陣bim，可以將bim看做9層bim1疊加在一起
bim(:,:,1) = bim1; % 將bim的第1層bim(:,:,1)賦值為bim1
% 接下來通過20度遞進的順時針旋轉依次生成bim的第2到9層，並將旋轉後的矩陣裁剪為和bim1相同大小
% 例如，i=2時，順時針旋轉bim1，並裁剪為和bim1相同的大小，賦值給bim的第2層
for i = 2:9,
  bim(:,:,i) = imrotate(bim1, -(i-1)*20, 'crop'); % 依次順時針旋轉20度，將結果賦值給bim的第2到9層
end


% 通過新增帶有方向權重的條紋來繪製正權重的視覺化圖
% make pictures of positive weights bs adding up weighted glyphs
s = size(w); % height * width * 9
w(w < 0) = 0; % 保證w中全部是正權重
im = zeros(bs*s(1), bs*s(2)); % 生成一個(width*bs)*(height*bs)的影象，即將濾波器w的尺寸擴大bs倍

% 遍歷濾波器權重向量w，將每個座標的值投影到9個方向上，然後擴大bs倍畫到影象im上
for i = 1:s(1), % 第i行(w原尺寸)
  iis = (i-1)*bs+1:i*bs; % 對應在影象im上的橫座標
  for j = 1:s(2), % 第j列(w原尺寸)
    jjs = (j-1)*bs+1:j*bs; % 對應在影象im上的縱座標
    for k = 1:9, % 遍歷9個方向
        % bim(:,:,k) * w(i,j,k)：如果濾波器向量在方向k上有正值的話，將這個值w(i,j,k)投影到大小為bs*bs的方向座標基bim的方向k上，
        % 然後將9個方向上的投影累加，累加值反映了濾波器中(i,j)位置在各個方向上的幅度大小，最後將累加值放到擴大bs倍的顯示影象im的對應位置上
        im(iis,jjs) = im(iis,jjs) + bim(:,:,k) * w(i,j,k); 
    end
    %imagesc(im); % 自己新增的語句，分析程式碼用，顯示畫圖過程
  end
  %imagesc(im); % 自己新增的語句，除錯用，顯示畫圖過程
end

下面圖1-6是HOGpicture中一個根濾波器視覺化圖的繪製過程：

圖1，根濾波器權重向量點(1,1)的視覺化圖2，加上點(1,2)的視覺化

圖3，完成第1行的視覺化圖4，完成前2行的視覺化

圖5，完成前10行的視覺化，可以看出人形了圖6，完成整個根濾波器的視覺化

（3）在visualizemodel函式中進行一些後處理，分割繪圖區域，依次呼叫HOGpicture畫出根濾波器和各個部件濾波器的視覺化圖，以及各個部件的變形花費圖。

在visualizemodel中呼叫HOGpicture畫出根濾波器的視覺化圖，返回值為圖6，然後將畫素值擴充到[0,255]並轉換為8位無符號整型，得到圖7：

圖7，根濾波器視覺化圖_Uint8

然後分割繪圖區域，將根濾波器的視覺化圖畫到指定區域，如圖8；再轉換為灰度圖，如圖9。

圖8，根濾波器_subplot 圖9，根濾波器_subplot_gray

再之後依次繪製各個部件的視覺化圖，如圖10是人體頭部的視覺化圖，覆蓋到根濾波器的對應位置。

圖10，頭部部件視覺化

圖11，左圖是根濾波器，右圖是各個部件的視覺化圖覆蓋到根的對應位置後的視覺化圖

從圖11中可以看出，部件濾波器明顯要比根濾波器細緻，能提供更多細節。

最後就是生成各個部件的變形花費圖了，這要用到各個部件的變形資訊，在模型的defs[]陣列中。defs陣列中，每個部件對應一個錨點座標和一個變形花費引數(4維向量)。計算部件內每個位置距離部件中心的距離，用變形特徵向量v = [Δx^2, Δx, Δy^2, Δy]' 和部件的變形花費相乘，得到的結果可以反映此位置的變形花費。值越大，說明變形費用越高，表明不是部件的理想位置；值越小，說明變形費用越低，表明是該部件的理想位置。反映到變形花費圖上，越亮(白)的地方花費越大，越暗(黑)的地方花費越小。

如下圖12是頭部的變形花費圖：

圖12，頭部的變形花費圖

最後，就獲得了完整的模型視覺化圖

圖13，左圖：根濾波器的視覺化圖；中圖：各個部件的視覺化圖覆蓋到根的對應位置後的視覺化圖；右圖：各個部件的變形花費圖

visualizemodel函式原始碼註釋如下：

function visualizemodel(model, components)
% 繪製模型的視覺化影象
% 引數：
% model：要視覺化的模型
% components：指定視覺化某個元件模型
%
% visualizemodel(model)
% Visualize a model.

clf; % 刪除當前繪圖
if nargin < 2 % 未指定視覺化哪個元件模型，則視覺化所有元件模型
  components = 1:model.numcomponents;
end

% 依次視覺化每個元件模型
k = 1;
for i = components
  visualizecomponent(model, i, length(components), k);
  k = k+1;
end


% 視覺化一個元件模型
% 引數
% model：要視覺化的模型
% c：當前要視覺化的第c個元件
% nc：此模型中總的元件個數
% k：指定繪製區域
function visualizecomponent(model, c, nc, k)

pad = 2; % 填充寬度
bs = 20; % 生成的影象相比於濾波器尺寸的擴大倍數

% 將 width*height*31 的濾波器引數向量濃縮為 width*height*9 的向量，所以返回值w是一個 width*height*9 的向量(width和height是濾波器的寬度和高度)
w = foldHOG(model.rootfilters{model.components{c}.rootindex}.w); % 簡化元件c的根濾波器向量，用以視覺化顯示模型

scale = max(w(:)); % w(:)返回由width*height*9的矩陣w的所有元素組成的一維向量，所以scale是w中所有元素的最大值，scale是一個標量

im = HOGpicture(w, bs); % 畫出濾波器權重向量w的視覺化圖，返回值im是大小為(width*bs)*(height*bs)的影象，畫素值為double型
%imagesc(im); % 自己新增的語句，分析程式碼用，顯示HOGpicture的繪圖結果

im = imresize(im, 2); % 將im的尺寸擴大一倍
%imagesc(im); % 自己新增的語句，分析程式碼用，顯示影象

im = padarray(im, [pad pad], 0); % 填充影象邊界，在影象im的上下左右各填充pad行(列)零值，填充後im的大小為(width*bs+pad*2)*(height*bs+pad*2)
im = uint8(im * (255/scale)); % 將im的值擴充到[0-255]並轉換為8位無符號整型
%imagesc(im); % 自己新增的語句，分析程式碼用，顯示影象

% 分割繪圖區域並畫出根濾波器的視覺化圖
numparts = length(model.components{c}.parts); % numparts：元件c的部件個數
% 根據元件個數和是否含有部件來分割繪圖區域
% 對於含nc個元件的模型，將繪圖區域分為nc行
if numparts > 0 % 對於有部件的模型，再將每行分為3列
  subplot(nc,3,1+3*(k-1)); % 選中分割後的第1+3(k-1)個繪圖區域，即每行的第一列
else % 對於沒有部件的模型，每行只有一列
  subplot(nc,1,k); % 選中每行第一列的繪圖區域
end
imagesc(im); % 縮放資料並顯示為圖片，畫到上一步選中的繪圖區域中
colormap gray; % 設為灰度圖
axis equal; % 使橫縱座標的刻度相同
axis off; % 不顯示座標軸


% 畫出元件c的帶部件的視覺化圖im和變形花費圖def_im
% draw parts and deformation model
if numparts > 0 % 只對含有部件的模型進行下面的操作
  
  def_im = zeros(size(im)); % 初始化變形花費圖def_im，和根濾波器的視覺化圖大小相同
  def_scale = 500;
  
  % 遍歷元件c的各個部件
  for i = 1:numparts
    
    % 生成部件i的視覺化圖
    w = model.partfilters{model.components{c}.parts{i}.partindex}.w; % 元件c的第i個部件的濾波器向量，尺寸為：width*height*31
    p = HOGpicture(foldHOG(w), bs); % 簡化濾波器向量w為width*height*9，並生成視覺化圖，返回值p是大小為(width*bs)*(height*bs)的影象，畫素值為double型
    %clf;imagesc(p); % 自己新增的語句，分析程式碼用，顯示影象
    
    p = padarray(p, [pad pad], 0); % 填充影象邊界，在影象p的上下左右各增加pad行(列)零值，填充後p的大小為(width*bs+pad*2)*(height*bs+pad*2)
    p = uint8(p * (255/scale)); % 將p的值擴充到[0-255]並轉換為8位無符號整型
    %imagesc(p); % 自己新增的語句，分析程式碼用，顯示影象
    
    % 將部件i的視覺化圖p的上下左右寬度為pad*2區域的邊界的值設為128，也就是加邊框
    p(:,1:2*pad) = 128;
    p(:,end-2*pad+1:end) = 128;
    p(1:2*pad,:) = 128;
    p(end-2*pad+1:end,:) = 128;
    %imagesc(p); % 自己新增的語句，分析程式碼用，顯示影象
    
    % paste into root 將部件i的視覺化圖p覆蓋到根濾波器視覺化圖影象im的對應位置上
    def = model.defs{model.components{c}.parts{i}.defindex}; % 元件c的第i個部件的錨點資訊
    x1 = (def.anchor(1)-1)*bs+1; % 部件i的錨點(左上角點)對應在根濾波器的視覺化圖im中的座標
    y1 = (def.anchor(2)-1)*bs+1; 
    x2 = x1 + size(p, 2)-1; % 部件i的右下角點在根濾波器的視覺化圖im中的座標
    y2 = y1 + size(p, 1)-1;
    im(y1:y2, x1:x2) = p; % 覆蓋到根濾波器的指定位置
    %imagesc(p); % 自己新增的語句，分析程式碼用，顯示影象
    
    % deformation model 生成部件i的變形花費圖並複製到整體的變形花費圖def_im中
    probex = size(p,2)/2; % p的寬度的一半
    probey = size(p,1)/2; % p的高度的一半
    % 生成p的每個位置(忽略邊框)的變形花費值
    for y = 2*pad+1:size(p,1)-2*pad % 第y行
      for x = 2*pad+1:size(p,2)-2*pad % 第x列
        px = ((probex-x)/bs); % 點(y,x)距部件i中心的水平距離，Δx
        py = ((probey-y)/bs); % 點(y,x)距部件i中心的垂直距離，Δy
        v = [px^2; px; py^2; py]; % 偏移量及其平方組合成一個變形特徵向量v = [Δx^2, Δx, Δy^2, Δy]'
        % 變形特徵向量 乘以 變形花費引數 並進行縮放，得到點(y,x)的變形花費值，儲存在p中
        % 根據計算公式可知，距離部件i中心越遠的地方，變形花費越大，反應到變形花費圖中就是越亮的地方變形花費越大
        p(y, x) = def.w * v * def_scale; 
      end
    end
    def_im(y1:y2, x1:x2) = p; % 將p中儲存的部件i各個位置的變形花費值複製到整體的變形花費圖def_im的對應位置
  end
  
  % 在對應繪圖區域畫出元件c的帶部件的視覺化圖im
  % plot parts
  subplot(nc,3,2+3*(k-1)); % 選中每行的第2列
  imagesc(im); % 繪製圖片
  colormap gray; % 設為灰度圖
  axis equal; % 使橫縱座標的刻度相同
  axis off; % 不顯示座標軸
  
  % 在對應繪圖區域畫出元件c的各個部件的變形花費圖
  % plot deformation model
  subplot(nc,3,3+3*(k-1)); % 選中每行的第3列
  imagesc(def_im); % 繪製圖片
  colormap gray; % 設為灰度圖
  axis equal; % 使橫縱座標的刻度相同
  axis off; % 不顯示座標軸
end

% set(gcf, 'Color', 'white')

相關連結：

Deformable Part Model 相關網頁：http://www.cs.berkeley.edu/~rbg/latent/index.html

Pedro Felzenszwalb的個人主頁：http://cs.brown.edu/~pff/

PASCAL VOC 目標檢測挑戰：http://pascallin.ecs.soton.ac.uk/challenges/VOC/

A Discriminatively Trained, Multiscale, Deformable Part Model [CVPR 2008] 中文翻譯

Object Detection with Discriminatively Trained Part Based Models [PAMI 2010]中文翻譯

有關可變形部件模型(Deformable Part Model)的一些說明

在Windows下執行Felzenszwalb的Deformable Part Models(voc-release4.01)目標檢測matlab原始碼

在Windows下執行Felzenszwalb的star-cascade DPM(Deformable Part Models)目標檢測Matlab原始碼

在windows下執行Felzenszwalb的Deformable Part Model(DPM)原始碼voc-release3.1來訓練自己的模型

用DPM(Deformable Part Model，voc-release3.1)演算法在INRIA資料集上訓練自己的人體檢測模型

關於DPM(Deformable Part Model)演算法中模型視覺化的解釋

關於資料視覺化的思考
2019-03-07
視覺化
疫情視覺化part3
2022-12-02
視覺化
DPM演算法
2018-03-22
演算法
關聯資料的釋出與視覺化
2022-02-14
視覺化
關於資料視覺化那些事
2023-10-23
視覺化
資料視覺化基本原理——視覺化模型
2019-03-01
視覺化模型
關於大屏視覺化，你想了解的都在這
2022-02-16
視覺化
基於鑽孔資料的三維地質模型視覺化
2022-05-12
模型視覺化
DAAM：首次利用視覺語言學解釋大型擴散模型
2023-02-14
視覺模型
MyEclipse的html頁面 design檢視中關閉視覺化介面
2018-03-08
EclipseHTML視覺化
「深度學習系列」CNN模型的視覺化
2019-08-27
深度學習CNN模型視覺化
視覺化中的資料
2019-02-27
視覺化
圖形演算法視覺化
2019-02-27
演算法視覺化
深入瞭解視覺語言模型
2023-03-01
視覺模型
關於FFMPEG的解碼模型
2020-12-19
模型
關於視覺化程式設計分類的民間智慧 – drossbucket
2021-07-02
視覺化程式設計ROS
關於計算機視覺中的自迴歸模型，這篇綜述一網打盡了
2024-12-01
計算機視覺模型
關於如何使用echarts實現市縣區地圖的視覺化
2024-03-18
Echarts地圖視覺化
關於微信小程式中如何實現資料視覺化-echarts動態渲染
2023-11-27
微信小程式視覺化Echarts
解說pytorch中的model=model.to(device)
2021-07-11
PyTorchdev
SAM視覺大模型的finetune
2024-05-23
視覺大模型
基於python----影像的表示和視覺化
2020-10-05
Python視覺化
視覺化經典模型的對比實驗總結
2022-03-05
視覺化模型
StartDT AI Lab | 視覺智慧引擎之演算法模型加速
2019-11-25
AI視覺演算法模型
【EF core】模型視覺化 EF Core Power Tools 【工具】
2024-03-26
模型視覺化
使用 TensorBoard 視覺化模型、資料和訓練
2021-01-20
ORB視覺化模型
C4 模型 - 視覺化架構設計
2020-12-22
模型視覺化架構
Myers差分演算法的理解、實現、視覺化
2022-06-08
演算法視覺化
資料分析師必看！關於大屏視覺化你想了解的都在這~
2022-03-23
視覺化
（在模仿中精進資料視覺化03）OD資料的特殊視覺化方式
2020-10-18
視覺化
詳解Python 中視覺化資料分析工作流程
2024-05-10
Python視覺化
Flutter中的資料視覺化charts家族
2019-12-27
Flutter視覺化
onnx模型視覺化以及pytorch運算元與onnx節點對應關係
2024-07-19
模型視覺化PyTorch
關於Select Model的兩篇譯文
2024-04-29
視覺化
2020-08-04
視覺化
探索風扇產品模型的3D視覺化魅力
2024-08-22
模型3D視覺化
pytorch模型結構視覺化，可顯示每層的尺寸
2021-01-10
PyTorch模型視覺化
微軟論文解讀：用於視覺對話的多步雙重注意力模型
2019-05-16
微軟視覺模型
json-schema 視覺化編輯器釋出了
2018-03-16
JSON視覺化

關於DPM(Deformable Part Model)演算法中模型視覺化的解釋

相關文章