你沒有大資料
今天在一個群裡,看到有人說:“國產資料庫都這麼強大了,把大資料的功能都實現了,大資料只需提供計算引擎就行。” 我隨後跟了一句:“ 我一直覺得大部分大資料場景,就是SQL沒寫好或者表設計問題導致的。有大資料場景的公司不多。 ” 隨後有幾個朋友覺得我說 的不錯。於是我就 覺得寫寫吧。
什麼是大資料定義不管是4V還是5V,第一個要解決的是量級。 2000年左右一般沒人說大資料,因為谷歌是2003/2005和2006年發表三篇論文以後才有。 但是我們說個 常識 2000年時候中國人口有13億不到14億這是常識吧。 我剛畢業的時候做公安系統,經常看到公安人員因為需要在人口庫中,輸入姓名或者身份證號進行查詢。 我想全國人口庫的資料庫至少也有10億級別吧。 即使不在世的人也在人口庫中。 有人可能說人口庫資料不準,要不然為什麼不count一下,而是要人口普查呢? 以我之愚見,我認為人口普查查的是 那 些和戶籍對不上的。 大致數量count一 把 也能查出來。 那麼我想說的是2000年左右人口庫的10億級的表。 比起今天有些業務系統的表的資料量如何? 大資料嗎?
如果查詢一個人的名字是前後%,那麼絕對的全表查,10幾億一定慢,資料量絕對大。那麼如 果精確查詢呢?比如查詢我薛曉剛。排除音同字不同等,完全匹配的當 時全國一共就9個。(我當時請公安查了一下,所以說那個就是全國庫)。用時不到1秒。大不大呢?就9條。說到這裡大家都應該明白我開頭提到今天群裡的故事了吧。大家也都是專業的,所以也心領神會 的贊同了。那麼如果一個系統中從設計、開發到運維等等都不知道怎麼最佳化查詢檢索的話,那麼遇到一定資料量的表全表查詢必然會很慢,必須要用大資料全家桶了。反之其實可以不用。也就是今天的主題。
但凡資料庫都有索引,可能會有質疑說,關係型資料庫的前後%在es中就很快。這裡要說的是es本身又叫做全文索引,他也是有索引的。我們可以嘗試一下沒有分詞的快不快? 比如有20G的日誌中搜尋%12%,也非常慢。所以我一直說大部分大資料場景,就是SQL沒寫好或者表設計問題導致的。我沒說所有,只是說大部分。BATJTMD等等一線網際網路公司妥妥的有大資料,五大行三大運營商作為非網際網路行業也是妥妥的有大資料的。有大資料的依然有很多企業,但是更多的企業是沒有。
如果說真的遇到需要最佳化但是沒有相關人員和技術怎麼辦?那就提升硬體,2000年時候硬碟速度每秒200M左右差不多了。現在請看看因特爾的傲騰,每秒幾百GB。也就是說如果要用傳統資料庫+傳統硬體,執行一個小時的,大資料可能10分鐘完成了,而傳統資料庫+新硬體可能3-5秒就完成了。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/637517/viewspace-2902046/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 大資料並沒有死,可能是你已經不認識它了大資料
- 大資料並沒有死,只不過你已經不認識它了大資料
- 資料清洗太難了?那是你沒有好工具,讓Smartbi來幫你!
- 錯失本科,百萬學生沒大學讀?資料上告訴你今年高考有多難
- 在大資料時代,我們真的沒有隱私嗎?大資料
- 你有沒思考過,如何加入這場大模型浪潮?大模型
- Element表格資料沒有重新渲染
- 沒有“好的”資料,AI就沒有未來?聽聽雲測資料怎麼說AI
- 2020年,有關蘋果App Store,你可能沒關注到的資料蘋果APP
- 沒有大資料在手,該怎麼為NLP應用深度學習?大資料深度學習
- 沒有程式設計基礎的小白可以學習大資料嗎?程式設計大資料
- 有沒有動態建立資料表的輪子?
- 資料治理到底治什麼?有沒有前景
- java培訓沒有錯 錯的是你沒有好好學Java
- 學透著13個爬蟲,這天下將沒有你爬不到的資料!爬蟲
- 你沒有看錯,爬網頁資料,C# 也可以像 Jquery 那樣網頁C#jQuery
- 資料分析報告沒有頭緒?看完Smartbi這篇介紹你就懂了!
- 資料庫沒有完美的儲存引擎資料庫儲存引擎
- 大資料分析模型有哪些大資料模型
- 大資料技術有哪些大資料
- 訊息推送平臺有沒有保證資料不丟?
- 有沒有完全自主的國產化資料庫技術資料庫
- 幽默:沒有資料庫的架構來了資料庫架構
- IT老兵告訴你資料中臺和大資料平臺有啥不一樣?大資料
- 目標沒有實現?那是因為你沒有做好計劃管理
- IT大佬告訴你大資料有哪些特點,新人學習必知大資料
- 噓!這有幾條沒人會告訴你的資料科學求職祕密資料科學求職
- FusionInsight MRS:你的大資料“管家”大資料
- 有沒有大佬知道這種資料應該怎麼抓取呀?
- 有哪些大資料處理工具?大資料
- 大資料渠道有哪些優勢大資料
- 大資料探勘有哪些技術大資料
- ETL都沒弄懂,談什麼大資料 ?我用一分鐘給你整明白大資料
- 資料治理始終沒有發揮成效,原因何在?
- 什麼是大資料?Python和大資料有什麼聯絡?大資料Python
- 大資料資訊保安問題有哪些大資料
- Laravel 修改資料與原資料一樣 導致沒有執行sqlLaravelSQL
- 小程式沒有入口?這些“場景”你可能還沒用上