架構之:資料流架構

flydean發表於2021-06-18

原文網址 : https://www.cnblogs.com/flydean/p/14898211.html

架構

簡介

有時候我們的系統主要是對輸入的資料進行處理和轉換，這些處理和轉換是互相獨立的，在這種情況下，輸入的資料經過轉換之後被放到指定的輸出中去。

在日常的工作中，我們會經常遇到這種資料處理的任務，那麼對於這樣的任務我們就可以採用資料流架構。

資料流架構

在實際工作中的流有很多種，最常見的就是I/O流，I / O緩衝區，管道等。不同的元件或者模組通過這些流進行連線。資料的流向可以是帶有迴圈的拓撲圖，沒有迴圈的線性結構或者樹形結構等。

資料流架構的主要目的是實現重用和方便的修改。它適用於在順序定義的輸入和輸出上進行一系列定義明確的獨立資料轉換或計算，例如編譯器和業務資料處理應用程式。一般來說有三種基本的資料流結構。

順序批處理

順序批處理是最常見也是最基礎的資料流架構。資料作為一個整體，會經過一個一個的處理單元，在上一個處理單元處理結束之後，才會進入到下一個處理單元。

我們看下順序批處理的流程圖：

資料被作為一個整體，從一個處理器傳到另外一個處理器。主要通過臨時檔案進行互動。每個處理器的輸出被作為下一個處理器的輸入，經過一次次的資料處理，最終得到要得的結果。

順序批處理的優點是每個處理都是獨立的，他們進行組合得到一個整體的順序處理架構。

當然缺點就是不能並行，只能序列執行，吞吐量也不夠。各個處理器之間只通過中間檔案進行互動，互動程度不高。

管道和過濾器

順序批處理中各個處理器的功能差異比較大，通常來說他們是不同的系統。如果在同一個系統中處理資料流任務，那麼就需要用到管道和過濾器。

java 8引入了stream和管道的概念。一個集合可以轉換成stream，通過對stream的操作，可以對整個資料流進行變換，最終得到想要的結果。

這種方法強調連續元件對資料的增量轉換。在這種方法中，資料流由資料驅動，整個系統可以分解為資料來源、過濾器、管道和資料接收器等元件。

模組之間的連線是資料流，它是先進/先出的緩衝區，可以是位元組流、字元流或任何其他型別的此類流。這種架構的主要優點在於它的併發和增量執行。

這種模式下，最重要的元件就是過濾器，過濾器是獨立的資料流轉換器。它轉換輸入資料流的資料，對其進行處理，並將轉換後的資料流寫入管道以供下一個過濾器處理。它以增量模式工作，一旦資料通過連線的管道到達，它就會開始工作。

上圖中的資料從管道出發，經過一個個的過濾器，最終得到處理過後的結果。

過濾器有兩種型別，分別是主動型過濾器和被動型過濾器。主動型過濾器可以主動從管道中拉取資料，並將處理過後的資料推出。這種模式主要用於UNIX 管道。而被動型過濾器則是負責接收管道推入的資料。

這種模式的優點是可以提供高併發和高吞吐量。缺點就是不適合動態互動。

流程控制

還有一種模式，既不是批量處理也不是管道模式，他是根據輸入內容的不同，來控制不同的執行流程。類似於我們程式中使用的判斷語句。

總結

上面我們介紹了幾種資料流的架構方式，希望大家能夠喜歡。

本文作者：flydean程式那些事

本文連結：http://www.flydean.com/07-data-flow-architecture/

本文來源：flydean的部落格

歡迎關注我的公眾號:「程式那些事」最通俗的解讀，最深刻的乾貨，最簡潔的教程，眾多你不知道的小技巧等你來發現！

架構之:serverless架構
2021-07-13
架構Server
淺談hdfs架構與資料流
2018-11-15
架構
資料架構之我見
2022-02-10
架構
【虹科乾貨】Lambda資料架構和Kappa資料架構——構建現代資料架構
2023-11-10
架構APP
按照業務領域畫資料架構圖業務架構資料架構
2024-04-21
架構
【細品架構4/100】架構之架構切分
2018-06-30
架構
Scrapy架構及資料流圖簡介
2018-03-13
架構
架構設計之資料分片
2021-08-04
架構
前端架構之小小node架構
2018-08-10
前端架構
架構演進之「微服務架構」
2019-03-01
架構微服務
MySQL 高可用架構之 MMM 架構
2019-08-12
MySql架構
架構之:軟體架構漫談
2021-06-02
架構
架構之:微服務架構漫談
2021-06-29
架構微服務
架構設計之架構的演變
2024-06-15
架構
軟體架構模式之微服務架構
2022-12-01
架構模式微服務
大資料架構如何做到流批一體？
2019-07-03
大資料架構
少即是多--資料架構之我見
2021-12-11
架構
大資料架構師
2019-04-05
大資料架構
資料管道架構概述
2024-06-12
架構
ES資料庫架構
2022-06-26
資料庫架構
面向資料的架構
2021-11-21
架構
Feed流系統重構-架構篇
2022-01-13
架構
前端架構之移動端混合架構（hybrid）
2018-07-10
前端架構
漫談“資料湖”之價值與架構
2019-07-04
架構
ABP框架之——資料訪問基礎架構
2022-05-25
框架架構
【細品架構2/100】架構之概念認知
2018-06-30
架構
大資料---（3）金融資料架構
2018-03-22
大資料架構
HBase 系統架構及資料結構
2019-06-24
架構資料結構
組織架構新型資料結構思考
2022-01-28
架構資料結構
資料管理架構：單體資料架構與分散式資料網格比較 - enyo
2021-08-08
架構分散式
react 之 fiber 架構
2024-10-05
React架構
拆解大資料匯流排平臺DBus的系統架構
2019-09-12
大資料架構
讓資料流動起來，RocketMQ Connect 技術架構解析
2022-11-14
MQ架構
MySQL高可用架構之Keepalived+主從架構部署
2018-05-18
MySql架構
【細品架構3/100】架構之問題識別
2019-02-20
架構
介面、資料結構、資訊架構的區別
2018-07-08
資料結構架構
SaaS架構：流程架構分析
2024-09-20
架構
ABP框架之——資料訪問基礎架構（下）
2022-06-23
框架架構

架構之:資料流架構

簡介

資料流架構

順序批處理

管道和過濾器

流程控制

總結

相關文章