《資料之美》:資料探勘、資料視覺化、雲端儲存及其他資料處理相關專案
這本《資料之美》(Beautiful Data)相對來說還算比較新,是從英文版翻譯過來的。英文版2009年出版。中文版2010年10月出版。由20篇相互獨立的文章組成。每篇講一個資料處理相關的專案。不涉及具體的技術細節,僅僅是概括說明原理、思路、過程、結果。
總體來說,閱讀起來有點晦澀。感覺作者基本都明白英文版的意思,不過有些地方中文表達上不夠通順。這在IT業的翻譯書中已經算不錯的組合了,強過中文過關但是不懂技術的情況。
其中講資料視覺化的文章有幾篇。還都比較有意思。比如第六章“照片檔案的地理之美”,說的是英國的一個名叫“Geograph”的專案,收集了大量 的英國的照片及普通使用者對照片的標籤,作者分析這些標籤,並且用圖形化的方法把許多分析結果展現出來;第11章“都市資料視覺化”,講的是把警察局的犯罪 發生的資料與地圖結合起來,預測犯罪發生的地點與型別從而提早預防;第12章“Sense.us的設計”講以視覺化手段分析美國150年以來的人口資料, 得出許多有趣的結論;第17章“資料淺析:探索形形色色的社會定型”說的是用圖形化方法分析一個網站的大量使用者相互之間的評論;第19章“美麗的政治數 據”同樣使用視覺化手段分析選舉相關資料。
第4章“PNUTShell中的雲端儲存設計”,說的是雅虎的一個雲端儲存的專案PNUTShell的設計思路和優缺點。這個專案面對的應用主要是社交 方面的應用,資料一致性要求不高,可用性、擴充套件性要求很高。因此就對一致性做了一些犧牲,滿足比較高的可用性和擴充套件性。資料只要最終按照操作順序執行了相 關的操作,最終一致就可以了。每一條資料都記錄了版本號,好知道自己執行到那個步驟了。每一條記錄還需要記錄自己是不是主備份。寫操作要先寫主備份然後逐 步同步到其他資料庫上。如果系統發現使用者比較頻繁地寫資料但是主備份所在伺服器的物理距離與使用者的物理距離比較遠,就自動把主備份記錄轉移到距離使用者更近 的伺服器上。如果主備份損壞,系統也會從剩下的資料中挑選最合適的一條做主備份。
第9章“探尋Deep Web”說的是如何讓搜尋引擎自動搜尋Form表單。Form表單可以有無窮個組合,這篇文章給出一些基本思路來讓搜尋引擎判斷如何去選擇下拉選單或者去填寫文字框,目標是用盡量少的操作步驟儘量多地獲取form表單後面的資料庫中的內容。作者:zuoqs
原文網址:http://www.cnblogs.com/zuoqs/archive/2011/03/13/1983044.html來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/16502878/viewspace-696444/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 綻放資料視覺化之美視覺化
- 資料血緣系列(3)—— 資料血緣視覺化之美視覺化
- MNIST資料集詳解及視覺化處理(pytorch)視覺化PyTorch
- 七牛雲端儲存資料,刪除無用資料
- 資料成本:雲端儲存成本高嗎如何節省資料儲存成本
- 資料視覺化能否代替資料分析視覺化
- 資料儲存--檔案儲存
- 資料處理之去除重複資料
- Flutter持久化儲存之資料庫儲存Flutter持久化資料庫
- 儲存資料之SharedPreference
- Python資料科學(八)- 資料探索與資料視覺化Python資料科學視覺化
- 盤點2021最佳資料視覺化專案視覺化
- Docker最全教程——資料庫容器化之持久儲存資料(十一)Docker資料庫
- 資料視覺化【十五】視覺化
- 資料看板視覺化視覺化
- Matlab資料視覺化Matlab視覺化
- 影象識別及處理相關資料集介紹
- Android中的資料儲存之檔案儲存Android
- 儲存器資料恢復相關知識資料恢復
- 關於資料視覺化的思考視覺化
- 關於資料視覺化那些事視覺化
- 關於InnoDB表資料和索引資料的儲存索引
- Python資料處理(二):處理 Excel 資料PythonExcel
- 資料分析--資料預處理
- 資料預處理-資料清理
- 資料清洗和資料處理
- Netflix如何使用bulldozer從資料倉儲批處理資料轉移到鍵值儲存?
- 萌新向Python資料分析及資料探勘 前言Python
- 資料視覺化專案---客源分析趨勢圖視覺化
- 資料分析視覺化專案(二)--谷歌App store視覺化谷歌APP
- 資料儲存(1):從資料儲存看人類文明-資料儲存器發展歷程
- Pandas多維特徵資料預處理及sklearn資料不均衡處理相關技術實踐-大資料ML樣本集案例實戰特徵大資料
- 資料視覺化之美:桑基圖的前世今生視覺化
- 資料預處理- 資料清理 資料整合 資料變換 資料規約
- UCI資料集詳解及其資料處理(附148個資料集及處理程式碼)
- 資料探勘專案的特徵和關鍵環節特徵
- 什麼是資料視覺化,為什麼資料視覺化很重要?視覺化
- 資料視覺化--實驗五:高維非空間資料視覺化視覺化
- 客戶端資料儲存概述客戶端