《資料探勘:實用機器學習技術》——資料探勘、機器學習一舉兩得

hzbook2008發表於2011-06-09
《資料探勘:實用機器學習技術》這本書由紐西蘭懷卡託大學電腦科學系的Ian H.Witten和Eibe Frank兩位專家集多年的研究和教學成果精心撰寫而成。本書最大特點是能滿足不同程度的讀者的需求,既有基本理論介紹又有實踐應用,讀者可以根據需要進行選讀而不失連貫性。[@more@]

無論是數字化管理的需要還是後工業化程式的要求,都使我們日益面對以前無法想像的海量資料。大型消費品公司和商場的市場部門、信用卡公司日復一日地面對如山的銷售資料,絞盡腦汁地挖掘其中潛在的市場訊號,工業企業的質管部門則需要正確讀懂源源不斷的質量情況波動報表。毫無疑問,理解乃至最終能夠利用這些資料,是值得認真對待的問題。

《資料探勘:實用機器學習技術》——資料探勘、機器學習一舉兩得
  《資料探勘:實用機器學習技術》一書由紐西蘭懷卡託大學電腦科學系的Ian H.Witten和Eibe Frank兩位專家集多年的研究和教學成果精心撰寫而成。本書(1999年初版)以及配套的Weka軟體一直受到全世界讀者和使用者的好評。2004年,Witten教授榮獲了國際資訊處理研究協會(IFIP)頒發的Namur獎項,這是一個兩年一度、用於獎勵那些在資訊和通訊技術的社會應用方面做出傑出貢獻及具有國際影響的榮譽獎項。2005年8月,在第11屆ACM SIGKDD國際會議上,懷卡託大學的Weka小組榮獲了資料探勘和知識探索領域的最高服務獎,Weka系統得到了廣泛的認可,被譽為資料探勘和機器學習歷史上的里程碑,是現今最完備的資料探勘工具之一(已有11年的發展歷史)。在本書第二版的翻譯之際,我們欣喜地發現,Weka的每月下載次數已超過萬次。本書被很多大學選作專業教材,並在許多學術研究文獻中被頻繁引用。這些都從側面驗證了本書的傑出成就。   本書的一大特點是能滿足不同程度的讀者的需求,既有基本理論介紹又有實踐應用,讀者可以根據需要進行選讀而不失連貫性。本書作者Witten教授一再強調,資料探勘及其不可或缺的技術基礎——機器學習,是一個新興的、充滿希望的領域,其應用的前景是極其寬廣的。本書既面向有一定專業技術基礎、想對技術層面作全面深入瞭解的讀者,也適合於技術基礎有限的普通初學者。對於初學者來說,要在短期內嘗試入門是難以想像的,然而這部分人群也正是本書要服務的物件。難能可貴的是本書所述的核心技術大都在Weka系統中得以實現,這不僅可作為學習工具,讀者還可以按照自己的需要使用Weka進行資料分析,或在此基礎上自行開發創新。..   對高等學校的學生來說,本書無疑是一本邏輯嚴密、內容翔實、極富實踐性的教科書;原本對資料探勘一無所知或有意瞭解一番的人們,無論是證券專業投資者還是超級市場資料分析員,甚至是面對一大堆彩票資料試圖做些什麼的業餘愛好者,相信我們,讀完這本循序漸進、例證充分的入門書籍,再輔之以紐西蘭懷卡託大學免費下載的、功能強大的Weka系統,成為一個專業水平的資料探勘者絕非遙不可及的夢想!

【讀者評論】

轉自:http://book.douban.com/review/1960038/

這本書雖然標題是Data Mining,但是核心內容還是機器學習。我理解“資料探勘”主要指的還是KDD,即基於資料庫的知識發現。在這個領域,基本的方法是聚類和關聯規則發現;而在機器學習領域,主要研究的是分類。  

這本書的內容主要是分類,也有一部分聚類的內容,關聯規則發現基本上沒有講。但它對分類講的很詳細,主要的思想都涉及到了,體系整理很好。它對相關的知識,如分類演算法的效能估計,如何在分類中結合成本考慮等也做了詳細的介紹。因此,認真讀讀這本書對於學好用好分類是很有幫助的。 

它的第二部分介紹了Weka這個機器學習框架的使用。用好這個框架能夠幫助簡化機器學習演算法研究中的一些輔助工作,作用還是很大的。
  
因此,推薦對機器學習,特別是分類有興趣的同志們看看這本書。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/16502878/viewspace-1050964/,如需轉載,請註明出處,否則將追究法律責任。

相關文章