《資料之美》:資料探勘、資料視覺化、雲端儲存及其他資料處理相關專案
這本《資料之美》(Beautiful Data)相對來說還算比較新,是從英文版翻譯過來的。英文版2009年出版。中文版2010年10月出版。由20篇相互獨立的文章組成。每篇講一個資料處理相關的專案。不涉及具體的技術細節,僅僅是概括說明原理、思路、過程、結果。
總體來說,閱讀起來有點晦澀。感覺作者基本都明白英文版的意思,不過有些地方中文表達上不夠通順。這在IT業的翻譯書中已經算不錯的組合了,強過中文過關但是不懂技術的情況。
其中講資料視覺化的文章有幾篇。還都比較有意思。比如第六章“照片檔案的地理之美”,說的是英國的一個名叫“Geograph”的專案,收集了大量 的英國的照片及普通使用者對照片的標籤,作者分析這些標籤,並且用圖形化的方法把許多分析結果展現出來;第11章“都市資料視覺化”,講的是把警察局的犯罪 發生的資料與地圖結合起來,預測犯罪發生的地點與型別從而提早預防;第12章“Sense.us的設計”講以視覺化手段分析美國150年以來的人口資料, 得出許多有趣的結論;第17章“資料淺析:探索形形色色的社會定型”說的是用圖形化方法分析一個網站的大量使用者相互之間的評論;第19章“美麗的政治數 據”同樣使用視覺化手段分析選舉相關資料。
第4章“PNUTShell中的雲端儲存設計”,說的是雅虎的一個雲端儲存的專案PNUTShell的設計思路和優缺點。這個專案面對的應用主要是社交 方面的應用,資料一致性要求不高,可用性、擴充套件性要求很高。因此就對一致性做了一些犧牲,滿足比較高的可用性和擴充套件性。資料只要最終按照操作順序執行了相 關的操作,最終一致就可以了。每一條資料都記錄了版本號,好知道自己執行到那個步驟了。每一條記錄還需要記錄自己是不是主備份。寫操作要先寫主備份然後逐 步同步到其他資料庫上。如果系統發現使用者比較頻繁地寫資料但是主備份所在伺服器的物理距離與使用者的物理距離比較遠,就自動把主備份記錄轉移到距離使用者更近 的伺服器上。如果主備份損壞,系統也會從剩下的資料中挑選最合適的一條做主備份。
第9章“探尋Deep Web”說的是如何讓搜尋引擎自動搜尋Form表單。Form表單可以有無窮個組合,這篇文章給出一些基本思路來讓搜尋引擎判斷如何去選擇下拉選單或者去填寫文字框,目標是用盡量少的操作步驟儘量多地獲取form表單後面的資料庫中的內容。作者:zuoqs
原文網址:http://www.cnblogs.com/zuoqs/archive/2011/03/13/1983044.html來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/16502878/viewspace-696444/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 綻放資料視覺化之美視覺化
- 新書預告《資料視覺化之美》新書視覺化
- 機器學習、資料探勘及其他機器學習
- MNIST資料集詳解及視覺化處理(pytorch)視覺化PyTorch
- 資料視覺化能否代替資料分析視覺化
- IOS資料儲存之Sqlite資料庫iOSSQLite資料庫
- IOS資料儲存之FMDB資料庫iOS資料庫
- 資料探勘之資料準備——原始資料的特性
- 資料成本:雲端儲存成本高嗎如何節省資料儲存成本
- 資料新聞的挖掘與視覺化處理視覺化
- 資料視覺化之美:桑基圖的前世今生視覺化
- 資料處理之去除重複資料
- OLAP和資料探勘——資料倉儲手冊
- Flutter持久化儲存之資料庫儲存Flutter持久化資料庫
- 資料看板視覺化視覺化
- 資料視覺化【十五】視覺化
- 大資料視覺化大資料視覺化
- 警惕“資料視覺化”視覺化
- Hive之 資料儲存Hive
- Python資料科學(八)- 資料探索與資料視覺化Python資料科學視覺化
- Docker最全教程——資料庫容器化之持久儲存資料(十一)Docker資料庫
- 資料視覺化,個人經驗總結(Echarts相關)視覺化Echarts
- 關於資料視覺化的思考視覺化
- 關於資料視覺化那些事視覺化
- 遇見大資料視覺化 : 那些 WOW 的資料視覺化案例大資料視覺化
- 大資料時代,人人都在談資料視覺化。大資料視覺化
- Android資料儲存之SQLCipher資料庫加密AndroidSQL資料庫加密
- 資料探勘——認識資料
- 資料視覺化之風向圖視覺化
- 大資料時代的資料儲存,非關係型資料庫MongoDB大資料資料庫MongoDB
- 資料探勘之關聯規則
- 資料視覺化學習資源視覺化
- 影象識別及處理相關資料集介紹
- 資料儲存
- 資料視覺化專案---客源分析趨勢圖視覺化
- 資料分析視覺化專案(二)--谷歌App store視覺化谷歌APP
- 儲存器資料恢復相關知識資料恢復
- 什麼是資料視覺化,為什麼資料視覺化很重要?視覺化