focus聚類研究系列一-----熟悉現有專案基礎(站在巨人的肩膀上)

maqianmaqian發表於2011-03-14

從現在開始,開始我真正的研究計劃:聚類獲取有價值的資訊。
今天開始詳細瞭解了已有的資源和專案程式碼,包含中文分詞,文件向量化,現有的KA+K-MEANS聚類演算法。但是據觀察,聚類效果上不是很滿意,主要是類簇的關鍵字抽取不夠準確,特徵選擇尚未考慮,聚類精度需要提高。
明天開始到下週末,研究
1.ka+k-means,其他k-means方法,找出系統不足點
2.研究特徵選擇方法,提高聚類前資料的質量

 

由於跟原文作者的經歷很像

http://www.blogjava.net/fullfocus/archive/2008/05/09/199608.html

相關文章