KPCA的matlab實現

One_H發表於2014-06-16

在網上看到了的實現,其中的好些註釋不能令自己滿意,故此,copy過來,自己修改註釋!其中有些地方也不準確!故此自己修改的結果!

function [train_kpca,test_kpca] = kpcaFordata(train,test,threshold,rbf_var)
%% Data kpca processing
if nargin <4
rbf_var=10000;%?
end
if nargin <3
threshold = 90;
end
%% 資料處理
patterns=zscore(train); %訓練資料標準化
test_patterns=zscore(test); %測試資料標準化
train_num=size(patterns,1); %train_num是訓練樣本的個數
test_num=size(test_patterns,1);%test_num是測試樣本的個數
cov_size = train_num; %cov_size是訓練樣本的個數
%% 計算核矩陣
for i=1:cov_size,
for j=i:cov_size,
K(i,j) = exp(-norm(patterns(i,:)-patterns(j,:))^2/rbf_var); %核函式 rbf_var ??
K(j,i) = K(i,j);
end
end
unit = ones(cov_size, cov_size)/cov_size;%cov_size是樣本的個數
%% 中心化核矩陣
K_n = K - unit*K - K*unit + unit*K*unit;% 中心化核矩陣
%% 特徵值分解
[evectors_1,evaltures_1] = eig(K_n/cov_size);
[x,index]=sort(real(diag(evaltures_1))); %sort每行按從小到大排序,x為排序後結果,index為索引
evals=flipud(x) ;% flipud函式實現矩陣的上下翻轉
index=flipud(index);
%% 將特徵向量按特徵值的大小順序排序
evectors=evectors_1(:,index);
%% 單位化特徵向量(這裡個人認為有問題)
% for i=1:cov_size
% evecs(:,i) = evectors(:,i)/(sqrt(evectors(:,i)));
% end

%%提取主成分  主成分所佔的百分比>threshold
train_eigval = 100*cumsum(evals)./sum(evals);
index = find(train_eigval >threshold);
train_kpca = zeros(train_num, index(1)); %train_num是訓練樣本的個數
%% evecs是單位化後的特徵矩陣,K_n是訓練資料的中心化核矩陣 將訓練資料進行對映,達到降維的目的!
train_kpca=[K_n * evectors(:,1:index(1))];
%% 重建測試資料
unit_test = ones(test_num,cov_size)/cov_size;%cov_size是訓練樣本的個數
K_test = zeros(test_num,cov_size); %test_num是測試樣本的個數, cov_size是訓練樣本的個數
for i=1:test_num, %test_num是測試樣本的個數
for j=1:cov_size,%cov_size是訓練樣本的個數
K_test(i,j) = exp(-norm(test_patterns(i,:)-patterns(j,:))^2/rbf_var);
end
end
K_test_n = K_test - unit_test*K - K_test*unit + unit_test*K*unit;
test_kpca = zeros(test_num, index(1));%test_num是測試樣本的個數

alfa=ones(train_num,index(1));

alfa = patterns*evectors./(evals(1:index(1)).ones(1,test_num));
test_kpca = [K_test_n * alfa];

 

附上綜合講解:百度搜尋  :KPCA核主成分分析   新浪部落格

 

相關文章