學霸大資料就是這樣煉成的
說全民探討大資料也許有些過,但毫無疑問,大資料現在已經成為企業開發社群中的一大熱門話題。大資料如此流行的一個關鍵原因是:多數企業不得不對日益增長的資料進行管理。通過分析龐大的資料來獲得有價值的資訊或判斷,這個被稱為“大資料”的概念正受到越來越廣泛的關注。從網際網路搜尋引擎,到龐大資訊量的檢索,再到基因科學或大氣科學的研究專案,人們關注並嘗試的資料量變得越來越龐大。曾經兆位元組資料的處理與現在企業面臨的千萬兆位元組相比,就變得蒼白無力了。
再看看那些稱霸網際網路的企業,Google、Amazon、Facebook、Twitter等,都有一個共同的特點,那就是“玩轉”了大資料,把資料分析“玩”到了極致,當然也不能否認,它們的商業模式非常創新,它們的領導者也非常優秀。
在當前大資料的衝擊中,如果還在糊里糊塗的前行,一定是很快就被淘汰掉的,如果不想被淘汰,那就必須弄懂大資料,弄懂當前大資料的現狀以及將來的發展趨勢。《大資料的衝擊》是弄懂這些的不二圖書。
《大資料的衝擊》
具體內容如下:
第1章:對大資料作出了明確的定義,並講解現在大資料為什麼會如此受關注。
第2章:講解了支撐大資料儲存、處理、分析的技術,以及其中主要領軍者的動向。這一章會涉及很多技術性話題,對技術不感興趣的讀者可以跳過,如果在第3章之後遇到一些看不懂的術語,再回過頭來參考這一章。
第3章:介紹了一些歐美企業對大資料的運用事例,這些企業包括eBay、Zynga、Centrica、Catalina Marketing等。
第4章:介紹了一些通過運用大資料帶來大幅業績增長的日本企業,這些企業包括小松、Recruit、GREE8、麥當勞等。
第5章:介紹了筆者所總結的企業使用者運用大資料的機會和模式。
第6章:就大資料的商業應用中無法避免的隱私問題,介紹了國內外的指導意見以及法律法規方面的趨勢。
第7章:介紹了將位於封閉世界中的資料開放出來以促進創新的“Open Data”運動,以及資料交易市場“Data Marketplace”。
第8章:介紹了伴隨著大資料時代的到來,企業在今後需要做出的準備,例如如何培養和吸引需求急劇高漲的“資料科學家”人才。
知己知彼後,應該學習技術了。《騰雲:雲端計算和大資料時代網路技術揭祕》通過閱讀本書,讀者將清楚地瞭解到如何在雲端計算與大資料時代構建安全、可靠、高速與靈活的網路。作者在IT技術網站“彎曲評論”(www.tektalk.org),撰寫了一系列以“撥雲見日”為標題的文章,剖析雲端計算和大資料下的新一代網路技術,引發了讀者的熱烈反響。《騰雲》即受此啟發而成。其語言風格深入淺出,適合業內技術人員系統學習。
也許你需要這本《大資料:網際網路大規模資料探勘與分散式處理》,因為它真正講到了資料探勘。正是將注意力集中在了極大規模資料上的挖掘,而且是從演算法的角度來看待資料探勘。其主要內容包括分散式檔案系統、相似性搜尋、搜尋引擎技術、頻繁項集挖掘、聚類演算法、廣告管理及推薦系統。在圖書章節設定上,每章末尾都有小結,對重點專有名詞會給出簡要的概況,讓大家對全章內容有一個鞏固和再認識。更有習幫助大家理解正文所講解的知識點。
《大資料:網際網路大規模資料探勘與分散式處理》是在Anand Rajaraman和Jeff Ullman於史丹佛大學多年所授的一門名為“Web挖掘”季度課程材料基礎上總結而成,其含金量已可見一斑。譯者是中科院計算技術研究所前瞻研究實驗室資訊檢索課題組組長王斌博士,他同樣也是《資訊檢索導論》的譯者,相信大家拿到這本書的時候會被王老師孜孜以求的態度所感染。
也許你還應該配合著《資料探勘導論(完整版)》這本書來看,想必會受益匪淺。閱讀這本書只要求具備很少的預備知識——不需要資料庫背景,只需要很少的統計學或數學背景知識。 書中包含大量的圖表、綜合示例和豐富的習題,並且使用示例、關鍵演算法的簡潔描述和習題,儘可能直接地聚焦於資料探勘的主要概念。
然後要讀的書越來越多,比如還需要《推薦系統實踐》、《演算法(第4版)》、《機器學習實戰》等,對於網站而言《可擴充套件的藝術——現代企業的Web架構、流程及組織》、《實用負載均衡技術》這樣的圖書也需要用到,企業要在大資料時代要實施量化,就要讀《量化:大資料時代的企業管理》,在大資料時代,你需要的不僅僅是帶有大資料字樣的圖書,還需要那些為了適應這個大資料時代而講技術的圖書。在這個電商大戰的節骨眼,多備些好書,才是對的。
相關文章
- 優秀的資料分析師是這樣煉成的
- HR「最強大腦」是怎樣煉成的?
- mybatis是怎樣煉成的MyBatis
- 黑客是怎樣煉成的黑客
- React 是怎樣煉成的React
- 阿里和浙大的“AI 訓練師助手”是這樣煉成的阿里AI
- 微課|中學生可以這樣學Python(7.3.2節):資料成員Python
- 原來大資料 Hadoop 是這樣儲存資料的大資料Hadoop
- Flutter bot_toast是怎樣煉成的FlutterAST
- C語言資料型別大學霸IT達人C語言資料型別
- 大資料學習:怎樣進行大資料的入門級學習?大資料
- 想學習大資料?這才是完整的大資料學習體系大資料
- 大資料應成為大學課程的重中之重大資料
- 從0開始學習大資料探勘分析,新手應該這樣學習大資料分析才靠譜大資料
- 航空公司系統是怎樣煉成的?
- 千億級HttpDNS服務是怎樣煉成的httpdDNS
- 【火爐煉AI】機器學習015-如何處理樣本數偏差較大的資料集AI機器學習
- 大牛如何煉成?記上海師大黃學輝教授
- 小白如何學習大資料開發,大資料學習路線是怎樣的?大資料
- 大資料怎樣入門學習?大資料
- 每秒採集幾十萬資料的大規模分散式爬蟲是如何煉成的?分散式爬蟲
- 走近原始碼:壓縮列表是怎樣煉成的原始碼
- 學習大資料,一定要了解大資料的這些用途大資料
- 空間大資料的資料變換與價值提煉大資料
- 大資料解讀:原來你是這樣的Z世代!大資料
- 一套用來處理海量資料的軟體工具應運而生,這就是大資料!大資料
- 深度學習高手該怎樣煉成?這位拿下阿里天池大賽冠軍的中科院博士為你規劃了一份專業成長路徑深度學習阿里
- 【進階】前端幸福感是怎樣煉成的(上)前端
- 【進階】前端幸福感是怎樣煉成的(下)前端
- 大資料要學什麼?看看這份大資料課程大綱大資料
- 一朵體驗好的雲是怎樣煉成的?
- 防騙大資料,朋友圈裡賣的這些東西...不是坑人就是害命!大資料
- 大資料初學者怎樣學習?Java工程師怎麼轉行大資料?大資料Java工程師
- 想成為不禿頭的資料工程師!你得擁有這樣一份修煉指南工程師
- 霸榜熱搜,百億流量,抖音爆款IP營銷煉成記
- 大資料成為解決這一難題的一個“抓手”。大資料
- 資深架構師Sum的故事:正則!入門就是這樣簡單架構
- 這就是現代php該有的樣子(一)PHP
- 這就是現代php該有的樣子(二)PHP