物聯網大資料平臺需要具備哪些功能

大資料小知識發表於2022-04-12

  物聯網是一個很寬泛的概念,是指各種裝置、機器都通過網際網路連線起來,車聯網、工業網際網路等都屬於物聯網範疇。根據Gartner報告,聯網的裝置在2019年已經超過142億,預計2021年將達到250億,這是一個巨大的數量。毫無疑問,我們需要一個物聯網大資料平臺來處理這些聯網裝置產生的海量資料。

  一個物聯網大資料平臺需要具備哪些功能?與通用的大資料平臺相比,它需要具備什麼樣的特徵呢?

  1.高效分散式

  必須是高效的分散式系統。物聯網產生的資料量巨大,僅中國而言,就有5億多臺智慧電錶,每臺電表每隔15分鐘採集一次資料,一天全國智慧電錶就會產生500多億條記錄。這麼大的資料量,任何一臺伺服器都無能力處理,因此處理系統必須是分散式的,水平擴充套件的。為降低成本,一個節點的處理效能必須是高效的,需要支援資料的快速寫入和快速查詢。

  2.實時處理

  必須是實時處理的系統。網際網路大資料處理,大家所熟悉的場景是使用者畫像、推薦系統、輿情分析等等,這些場景並不需要什麼實時性,批處理即可。但是對於物聯網場景,需要基於採集的資料做實時預警、決策,延時要控制在秒級以內。如果計算沒有實時性,物聯網的商業價值就大打折扣。

  3.高可靠性

  需要運營商級別的高可靠服務。物聯網系統對接的往往是生產、經營系統,如果資料處理系統當機,直接導致停產,產生經濟有損失、導致對終端消費者的服務無法正常提供。比如智慧電錶,如果系統出問題,直接導致的是千家萬戶無法正常用電。因此物聯網大資料系統必須是高可靠的,必須支援資料實時備份,必須支援異地容災,必須支援軟體、硬體線上升級,必須支援線上IDC機房遷移,否則服務一定有被中斷的可能。

  4.高效快取

  需要高效的快取功能。絕大部分場景,都需要能快速獲取裝置當前狀態或其他資訊,用以報警、大屏展示或其他。系統需要提供一高效機制,讓使用者可以獲取全部、或符合過濾條件的部分裝置的最新狀態。

  5.實時流式計算

  需要實時流式計算。各種實時預警或預測已經不是簡單的基於某一個閾值進行,而是需要通過將一個或多個裝置產生的資料流進行實時聚合計算,不只是基於一個時間點、而是基於一個時間視窗進行計算。不僅如此,計算的需求也相當複雜,因場景而異,應容許使用者自定義函式進行計算。

  6.資料訂閱

  需要支援資料訂閱。與通用大資料平臺比較一致,同一組資料往往有很多應用都需要,因此係統應該提供訂閱功能,只要有新的資料更新,就應該實時提醒應用。而且這個訂閱也應該是個性化的,容許應用設定過濾條件,比如只訂閱某個物理量五分鐘的平均值。

  7.和歷史資料處理合二為一

  實時資料和歷史資料的處理要合二為一。實時資料在快取裡,歷史資料在持久化儲存介質裡,而且可能依據時長,保留在不同儲存介質裡。系統應該隱藏背後的儲存,給使用者和應用呈現的是同一個介面和介面。無論是訪問新採集的資料還是十年前的老資料,除輸入的時間引數不同之外,其餘應該是一樣的。

  8.資料持續穩定寫入

  需要保證資料能持續穩定寫入。對於物聯網系統,資料流量往往是平穩的,因此資料寫入所需要的資源往往是可以估算的。但是變化的是查詢、分析,特別是即席查詢,有可能耗費很大的系統資源,不可控。因此係統必須保證分配足夠的資源以確保資料能夠寫入系統而不被丟失。準確的說,系統必須是一個寫優先系統。

  9.資料多維度分析

  需要對資料支援靈活的多維度分析。對於聯網裝置產生的資料,需要進行各種維度的統計分析,比如從裝置所處的地域進行分析,從裝置的型號、供應商進行分析,從裝置所使用的人員進行分析等等。而且這些維度的分析是無法事先想好的,而是在實際運營過程中,根據業務發展的需求定下來的。因此物聯網大資料系統需要一個靈活的機制增加某個維度的分析。

  10.支援資料計算

  需要支援資料降頻、插值、特殊函式計算等操作。原始資料的採集可能頻次挺高,但具體分析時,往往不需要對原始收據進行,而是資料降頻之後。系統需要提供高效的資料降頻操作。裝置是很難同步的,不同裝置採集資料的時間點是很難對齊的,因此分析一個特定時間點的值,往往需要插值才能解決,系統需要提供線性插值、設定固定值等多種插值策略才行。工業網際網路裡,除通用的統計操作之外,往往還需要支援一些特殊函式,比如時間加權平均。

  11.即席分析和查詢

  需要支援即席分析和查詢。為提高大資料分析師的工作效率,系統應該提供一命令列工具或容許使用者通過其他工具,執行SQL查詢,而不是非要通過程式設計介面。查詢分析的結果可以很方便的匯出,再製作成各種圖示。

  12.靈活資料管理策略

  需要提供靈活的資料管理策略。一個大的系統,採集的資料種類繁多,而且除採集的原始資料外,還有大量的衍生資料。這些資料各自有不同的特點,有的採集頻次高,有的要求保留時間長,有的需要多個副本以保證更高的安全性,有的需要能快速訪問。因此物聯網大資料平臺必須提供多種策略,讓使用者可以根據特點進行選擇和配置,而且各種策略並存。

  13.開放的系統

  必須是開放的。系統需要支援業界流行的標準SQL,提供各種語言開發介面,包括C/C++,Java,Go,Python,RESTful等等,也需要支援Spark,R,Matlab等等,方便整合各種機器學習、人工智慧演算法或其他應用,讓大資料處理平臺能夠不斷擴充套件,而不是成為一個孤島。

  14.支援異構環境

  系統必須支援異構環境。大資料平臺的搭建是一個長期的工作,每個批次採購的伺服器和儲存裝置都會不一樣,系統必須支援各種檔次、各種不同配置的伺服器和儲存裝置並存。

  15.支援邊雲協同

  需要支援邊雲協同。要有一套靈活的機制將邊緣計算節點的資料上傳到雲端,根據具體需要,可以將原始資料,或加工計算後的資料,或僅僅符合過濾條件的資料同步到雲端,而且隨時可以取消,更改策略。

  16.單一後臺管理

  需要單一的後臺管理系統。便於檢視系統執行狀態、管理叢集、管理使用者、管理各種系統資源等,而且系統能夠與第三方IT運維監測平臺無縫整合,便於管理。

  17.私有化部署

  便於私有化部署。因為很多企業出於安全以及各種因素的考慮,希望採用私有化部署。而傳統的企業往往沒有很強的IT運維團隊,因此在安裝、部署上需要做到簡單、快捷,可維護性強。

  物聯網大資料平臺需要具備哪些功能.中琛魔方大資料平臺表示雖說物聯網大資料平臺本身也是在處於不斷的演變之中,但是總體目標是不會更改的,那就是可伸縮、高效、靈活、可靠、開放、易維護、簡單等等,只有這樣才能夠更好地方便大眾生活。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69936596/viewspace-2886675/,如需轉載,請註明出處,否則將追究法律責任。

相關文章