Cassandra+Akka+Spark分散式機器學習架構
目前基於Mesos的 Spark, Akka, Cassandra 和 Kafka (簡稱SMACK)架構將機器學習 大資料分析 快資料實時流處理和叢集自動化管理結合一起,形成大資料領域的主流架構。
資料分為快資料和大資料;快資料包括相關的最新資訊以及提供可操作的事件。大資料是有關分析與模型和學習,聚類,分類以及組織事實。
下圖是展示對大資料和快資料分別進行批處理和流處理以後,進入分散式資料儲存系統,然後再為終端使用者分別提供分析報告和實時提醒報警服務。
資料分為快資料和大資料;快資料包括相關的最新資訊以及提供可操作的事件。大資料是有關分析與模型和學習,聚類,分類以及組織事實。
下圖是展示對大資料和快資料分別進行批處理和流處理以後,進入分散式資料儲存系統,然後再為終端使用者分別提供分析報告和實時提醒報警服務。
[img index=1]
為了實現這樣一個目標設計,使用Akka-Cassandra-Spark 組合實現,如下圖:
[img index=2]
Spark從Cassandra中釋放資料,建立模型,豐富模型,改造模型後再寫入到Cassandra;而Akka負責從Kafka訊息系統接受處理事件,以及實現實時響應式的提醒和報警服務。
使用Akka持久化接受進來的事件到Cassandra,也就是將Akka有態actor將其內部狀態持久化儲存,這樣當遭遇崩潰或重新啟動或叢集遷移時,actor能夠從Cassandra中恢復狀態,這是使用event sourcing原理,只是將改變actor狀態的事件持久化,而不是直接持久狀態,這是以一種日誌方式儲存。這種方式有很高的事務性和複製高效性。
Apache Spark機器學習初級教程
英文資料:
使用Spark MLlib, Akka and Cassandra進行實時異常檢測
Using Spark to analyse Akka persistence journal in Cassandra
Streaming Big Data with Spark, Spark Streaming, Kafka, Cassandra and Akka
[該貼被banq於2015-10-31 14:29修改過]
相關文章
- 分散式機器學習中的模型架構分散式機器學習模型架構
- 分散式WebSocket架構分散式Web架構
- jeesz分散式架構-分散式高可用分散式架構
- 分散式架構的概述分散式架構
- ClickHouse 分散式架構(qbit)分散式架構
- 認識分散式架構分散式架構
- KAFKA介紹(分散式架構)Kafka分散式架構
- J2EE分散式架構 dubbo+springmvc+mybatis+ehcache+redis分散式架構分散式架構SpringMVCMyBatisRedis
- 基於SpringCloud分散式架構SpringGCCloud分散式架構
- 剖析ElasticSearch基礎分散式架構Elasticsearch分散式架構
- 分散式系統的架構思路分散式架構
- 沒有完美的分散式架構分散式架構
- 分散式 PostgreSQL - Citus 架構及概念分散式SQL架構
- 分散式 PostgreSQL - Citus 架構及概念分散式SQL架構
- 基於 dubbo 的分散式架構分散式架構
- 分散式快取架構綜述分散式快取架構
- 分散式網際網路架構之路分散式架構
- 一文看懂 PostgreSQL 分散式架構SQL分散式架構
- springmvc+mybatis +Jeesz 分散式架構SpringMVCMyBatis分散式架構
- 微服務架構下分散式session管理微服務架構分散式Session
- MongoDB中的分散式叢集架構MongoDB分散式架構
- 微服務分散式架構之redis篇微服務分散式架構Redis
- 分散式|Dubbo架構設計詳解分散式架構
- springmvc + mybatis + ehcache + redis 分散式架構SpringMVCMyBatisRedis分散式架構
- 分散式發號器架構設計分散式架構
- 圖解分散式架構的演進圖解分散式架構
- 架構解密:從分散式到微服務架構解密分散式微服務
- springmvc + mybatis + ehcache + redis 分散式 架構SpringMVCMyBatisRedis分散式架構
- 分散式快取GemFire架構介紹分散式快取架構
- (二) MdbCluster分散式記憶體資料庫——分散式架構1分散式記憶體資料庫架構
- [爬蟲架構] 如何設計一個分散式爬蟲架構爬蟲架構分散式
- 分散式架構篇 | 如何在分散式架構下完美實現“全域性資料一致性”?分散式架構
- 掘金 AMA:聽分散式架構 SOFA 的開源負責人黃挺聊分散式架構和開源分散式架構
- 構建Spring Cloud微服務分散式雲架構SpringCloud微服務分散式架構
- PostgreSQL的幾種分散式架構對比SQL分散式架構
- [分散式][高併發]高併發架構分散式架構
- 分散式架構基礎:Java RMI詳解分散式架構Java
- 分散式架構知識體系必讀分散式架構