大資料的發展前提
關於大資料的概念其實在1998年已經就有人提出了,但是到了現在才開始有所發展,這些其實都是和當下移動網際網路的快速發展分不開的,移動網際網路的高速發展,為大資料的產生提供了更多的產生大資料的硬體前提,比如說智慧手機,智慧硬體,車聯網,pda等資料的產生終端。這些智慧通過行動通訊技術和人們的生活緊密的結合在一起,在人流、車流的背後產生了資訊流,也就產生了大量的資料。
其次就是行動通訊技術的快速發展,在2G時代,無線網速慢,資料產生也非常慢,資料體量也不夠,所以還是無法形成大資料,而到了4G時代,終端資料的增加,使得任何的移動終端都在無時無刻的產生著大量的資料,這個也是大資料到來的一個條件之一。
第三個方面的就是大資料相關技術的飛速發展,如雲端計算,雲端儲存技術,他們的快速發展,是大資料誕生的溫床,如果沒有這些技術,即使有大量的資料也只能望洋興嘆。傳統的儲存技術相對落後,根據不同資料實行單一儲存,這個顯然滿足不了大資料的需求,而云時代的儲存系統需要的不僅僅是容量的提升,對於效能的要求同樣迫切,與以往只面向有限的使用者不同,在雲時代,儲存系統將面向更為廣闊的使用者群體,使用者數量級的增加使得儲存系統也必須在吞吐效能上有飛速的提升,只有這樣才能對請求作出快速的反應,雲儲存技術的成熟為大資料的快速發展奠定了基礎。
什麼是大資料?
不過說起大資料,估計大家都覺得只聽過概念,但是具體是什麼東西,怎麼定義,沒有一個標準的東西,因為在我們的印象中好像很多公司都叫大資料公司,業務形態則有幾百種,感覺不是很好理解,所以我建議還是從字面上來理解大資料,在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大資料時代》提到了大資料的4個特徵,一個是數量大,一個是價值大,一個是速度快,一個是多樣性。
一個是數量比較大,大致有多大,就是大到PB級別,甚至ZB級別,1PB等於1024TB,1TB等於1024G,那麼1PB等於100多G,當然了具體的計算方法可以相關資料資料進行查詢,總之,和傳統的單個網站資料庫儲存的資料相比,已經是它的上百倍還多,而只有資料體量達到了PB級別以上,才能被稱為大資料。第二個是價值大,價值是大體量資料的更深一步的演變,就是說,你如果有1PB以上的全國所有20-35年輕人的上網資料的時候,那麼它自然就有了商業價值,比如通過分析這些資料,我們就知道這些人的愛好,進而指導產品的發展方向等等。如果有了全國幾百萬病人的資料,根據這些資料進行分析就能預測疾病的發生。這些都是大資料的價值。
第三個就是多樣性,如果只有單一的資料,那麼這些資料就沒有了價值,比如只有單一的個人資料,或者單一的使用者提交資料,這些資料還不能稱為大資料,所以說大資料還需要是多樣性的,比如當前的上網使用者中,年齡,學歷,愛好,性格等等每個人的特徵都不一樣,這個也就是大資料的多樣性,當然瞭如果擴充套件到全國,那麼資料的多樣性會更強,每個地區,每個時間段,都會存在各種各樣的資料多樣性。
第四個是速度快,就是通過演算法對資料的邏輯處理速度非常快,1秒定律,可從各種型別的資料中快速獲得高價值的資訊,這一點也是和傳統的資料探勘技術有著本質的不同。
總之,這些就是大資料的四個特徵,只有具備了這些特徵的資料才能稱為大資料,那麼實際中的大資料是怎麼樣呢?業內著名的和大資料相關的公司,七牛雲端儲存將要在8月29日、30日舉辦一次大資料的會議,對於位於大資料技術產業鏈上的公司來說,我們應該可以獲得更多的乾貨爆料。
大資料的三個層次
說起大資料,大資料有三個層次,第一個是資料採集層,以App、saas為代表的服務。第二個技術服務層,以七牛雲端儲存為代表的大資料技術服務層,這些包括資料的儲存,資料的分析,資料的挖掘等等,第三個是資料應用層,以資料為基礎,為將來的移動社交、交通、教育,金融進行服務。下面我就主要的講下三個層面。
資料採集層——App、saas服務
在移動網際網路時代,大資料的來源層有兩個方面,一個方面是面向個人的資料來源前端如各種各樣的App,一方面是面向企業服務的saas服務的產品。面向個人的App
在飲食領域的App,如餓了麼,使用者通過App進行選餐,下單,通過App互動就會形成飲食領域的大資料;在o2o領域,如嗒嗒巴士,使用者通過使用App進行乘坐交通,上班下班,就會形成交通領域的大資料,如穿衣助手,使用者通過App進行選擇衣服顏色,樣式,進行搭配,就會形式服務類的大資料,當然了還有秒拍、快看等娛樂類的消費資料。面向個人使用者的App,以滿足使用者的需求為主要出發點,產生使用者的資料,這些資料包括以個人基礎的資料,也包括隨群體資料,隨著App使用者量的增長,這些App資料就成了大資料。
面向個人的資料來源,直接通過使用者的需求產生資料,而面向企業服務的——saas服務則不一樣,他們通過為企業提供一套完整的解決方案,而產生資料,比如圖靈機器人,人臉識別技術,氣象plus、海康威視等,他們通過完美的解決方案服務企業,最終服務使用者,從而產生大資料,資料採集層,是大資料的來源,也是大資料的基礎。
雲端儲存對大資料的促進作用
有了資料採集層,那麼下一步就是資料的儲存層了,使用雲端儲存技術將資料儲存在雲主機上,保證資料的安全、穩定、高效都需要雲端儲存技術來完成。雲端儲存主要負責資料的儲存以及計算,比如七牛的雲端儲存技術,雲端儲存技術是大資料發展跨不過去的一道坎,如果沒有云儲存技術,大資料就不能得到發展。
完整內容點此檢視