14.3 將可分類資料變為向量

wesun發表於2013-12-06

在Mahout中,Vector(向量)中儲存的是浮點值,並且這些浮點值會用整型做索引。本節會告訴你如何將資料編碼為Vector,解釋什麼是特徵雜湊,並演示Mahout API如何做特徵雜湊。我們還會看一下如何編碼與變數相關的不同型別值。

在前面解釋聚類的章節中已經用過向量了。很多種分類器,特別是Mahout中的,基本上都是以線性代數為基礎的,因此要求訓練資料以Vector形式輸入。

相關文章