機器學習實戰-邊學邊讀python程式碼(4)

harlanc發表於2015-11-26

程式2-4 分類器針對約會網站的測試程式碼(4)

def datingClassTest():
hoRatio = 0.10

//將檔案讀入記憶體矩陣
datingDataMat,datingLabels = file2matrix(`datingTestSet.txt`)

//歸一化,請看(3)
normMat, ranges, minVals = autoNorm(datingDataMat)
m = normMat.shape[0]

//訓練樣本從第m*hoRatio行開始
numTestVecs = int(m*hoRatio)
errorCount = 0.0

//待預測向量從0開始到m*hoRatio結束
for i in range(numTestVecs):

/*

normMat[i,:] 為取出mormMat的第i+1行,作為待預測的向量

關於normMat[numTestVecs:m,:],為訓練樣本,取出從i+1行開始的m行,這裡m可以大於矩陣的總行數,看下面的例子。

>>> a = zeros((3,3))
>>> a
array([[ 0., 0., 0.],
[ 0., 0., 0.],
[ 0., 0., 0.]])
>>> a[1][0]=2
>>> a[2][0]=3
>>> a
array([[ 0., 0., 0.],
[ 2., 0., 0.],
[ 3., 0., 0.]])
>>> a[0:2,:]
array([[ 0., 0., 0.],
[ 2., 0., 0.]])
>>> a[0:4,:]
array([[ 0., 0., 0.],
[ 2., 0., 0.],
[ 3., 0., 0.]])
>>> a[1:4,:]
array([[ 2., 0., 0.],
[ 3., 0., 0.]])

datingLabels[numTestVecs:m] 為訓練樣本的標籤向量,用於預測待預測向量,

取出待預測向量離訓練樣本最小的3個標籤,

*/
classifierResult = classify0(normMat[i,:],normMat[numTestVecs:m,:],
datingLabels[numTestVecs:m],3)

//檢查預測值和實際值是否相符合
print “the classifier came back with: %d, the real answer is: %d”
% (classifierResult, datingLabels[i])

if (classifierResult != datingLabels[i]): errorCount += 1.0
print “the total error rate is: %f” % (errorCount/float(numTestVecs))



作者:
HarlanC

部落格地址:
http://www.cnblogs.com/harlanc/

個人部落格:
http://www.harlancn.me/

本文版權歸作者和部落格園共有,歡迎轉載,但未經作者同意必須保留此段宣告,且在文章頁面明顯位置給出,
原文連結

如果覺的博主寫的可以,收到您的贊會是很大的動力,如果您覺的不好,您可以投反對票,但麻煩您留言寫下問題在哪裡,這樣才能共同進步。謝謝!


相關文章