學霸大資料就是這樣煉成的

紫鳳發表於2013-06-06

enter image description here

說全民探討大資料也許有些過,但毫無疑問,大資料現在已經成為企業開發社群中的一大熱門話題。大資料如此流行的一個關鍵原因是:多數企業不得不對日益增長的資料進行管理。通過分析龐大的資料來獲得有價值的資訊或判斷,這個被稱為“大資料”的概念正受到越來越廣泛的關注。從網際網路搜尋引擎,到龐大資訊量的檢索,再到基因科學或大氣科學的研究專案,人們關注並嘗試的資料量變得越來越龐大。曾經兆位元組資料的處理與現在企業面臨的千萬兆位元組相比,就變得蒼白無力了。

再看看那些稱霸網際網路的企業,Google、Amazon、Facebook、Twitter等,都有一個共同的特點,那就是“玩轉”了大資料,把資料分析“玩”到了極致,當然也不能否認,它們的商業模式非常創新,它們的領導者也非常優秀。

在當前大資料的衝擊中,如果還在糊里糊塗的前行,一定是很快就被淘汰掉的,如果不想被淘汰,那就必須弄懂大資料,弄懂當前大資料的現狀以及將來的發展趨勢。《大資料的衝擊》是弄懂這些的不二圖書。

            enter image description here

                  《大資料的衝擊

具體內容如下:

第1章:對大資料作出了明確的定義,並講解現在大資料為什麼會如此受關注。

第2章:講解了支撐大資料儲存、處理、分析的技術,以及其中主要領軍者的動向。這一章會涉及很多技術性話題,對技術不感興趣的讀者可以跳過,如果在第3章之後遇到一些看不懂的術語,再回過頭來參考這一章。

第3章:介紹了一些歐美企業對大資料的運用事例,這些企業包括eBay、Zynga、Centrica、Catalina Marketing等。

第4章:介紹了一些通過運用大資料帶來大幅業績增長的日本企業,這些企業包括小松、Recruit、GREE8、麥當勞等。

第5章:介紹了筆者所總結的企業使用者運用大資料的機會和模式。

第6章:就大資料的商業應用中無法避免的隱私問題,介紹了國內外的指導意見以及法律法規方面的趨勢。

第7章:介紹了將位於封閉世界中的資料開放出來以促進創新的“Open Data”運動,以及資料交易市場“Data Marketplace”。

第8章:介紹了伴隨著大資料時代的到來,企業在今後需要做出的準備,例如如何培養和吸引需求急劇高漲的“資料科學家”人才。

知己知彼後,應該學習技術了。《騰雲:雲端計算和大資料時代網路技術揭祕》通過閱讀本書,讀者將清楚地瞭解到如何在雲端計算與大資料時代構建安全、可靠、高速與靈活的網路。作者在IT技術網站“彎曲評論”(www.tektalk.org),撰寫了一系列以“撥雲見日”為標題的文章,剖析雲端計算和大資料下的新一代網路技術,引發了讀者的熱烈反響。《騰雲》即受此啟發而成。其語言風格深入淺出,適合業內技術人員系統學習。

           enter image description here

            《騰雲:雲端計算和大資料時代網路技術揭祕

也許你需要這本《大資料:網際網路大規模資料探勘與分散式處理》,因為它真正講到了資料探勘。正是將注意力集中在了極大規模資料上的挖掘,而且是從演算法的角度來看待資料探勘。其主要內容包括分散式檔案系統、相似性搜尋、搜尋引擎技術、頻繁項集挖掘、聚類演算法、廣告管理及推薦系統。在圖書章節設定上,每章末尾都有小結,對重點專有名詞會給出簡要的概況,讓大家對全章內容有一個鞏固和再認識。更有習幫助大家理解正文所講解的知識點。

大資料:網際網路大規模資料探勘與分散式處理》是在Anand Rajaraman和Jeff Ullman於史丹佛大學多年所授的一門名為“Web挖掘”季度課程材料基礎上總結而成,其含金量已可見一斑。譯者是中科院計算技術研究所前瞻研究實驗室資訊檢索課題組組長王斌博士,他同樣也是《資訊檢索導論》的譯者,相信大家拿到這本書的時候會被王老師孜孜以求的態度所感染。

          enter image description here

          《大資料:網際網路大規模資料探勘與分散式處理

也許你還應該配合著《資料探勘導論(完整版)》這本書來看,想必會受益匪淺。閱讀這本書只要求具備很少的預備知識——不需要資料庫背景,只需要很少的統計學或數學背景知識。 書中包含大量的圖表、綜合示例和豐富的習題,並且使用示例、關鍵演算法的簡潔描述和習題,儘可能直接地聚焦於資料探勘的主要概念。

             enter image description here

                 《資料探勘導論(完整版)

然後要讀的書越來越多,比如還需要《推薦系統實踐》、《演算法(第4版)》、《機器學習實戰》等,對於網站而言《可擴充套件的藝術——現代企業的Web架構、流程及組織》、《實用負載均衡技術》這樣的圖書也需要用到,企業要在大資料時代要實施量化,就要讀《量化:大資料時代的企業管理》,在大資料時代,你需要的不僅僅是帶有大資料字樣的圖書,還需要那些為了適應這個大資料時代而講技術的圖書。在這個電商大戰的節骨眼,多備些好書,才是對的。

相關文章