阿里雲大資料ACP認證知識點梳理3——產品特點(資料整合)

朱祺發表於2018-12-11

資料整合,是阿里集團對外提供的穩定高效、彈性伸縮的資料同步平臺。致力於提供複雜網路環境下、豐富的異構資料來源之間資料高速穩定的資料移動及同步能力。

資料整合提供豐富的資料來源支援,如下所示:

文字儲存(FTP / SFTP / OSS / 多媒體檔案等)。
資料庫(RDS / DRDS / MySQL / PostgreSQL 等)。
NoSQL(Memcache / Redis / MongoDB / HBase 等)。
大資料(MaxCompute / AnalyticDB / HDFS 等)。
MPP 資料庫(HybridDB for MySQL 等)。

同步開發提供兩種開發模式:嚮導模式和指令碼模式。

嚮導模式:提供嚮導式的開發引導,通過視覺化的填寫和下一步的引導,幫助快速完成資料同步任務的配置工作。嚮導模式的學習成本低,但無法享受到一些高階功能。

指令碼模式:您可以通過直接編寫資料同步的 JSON 指令碼來完成資料同步開發,適合高階使用者,學習成本較高。指令碼模式可以提供更豐富靈活的能力,做精細化的配置管理。

網路型別分為:經典網路、專有網路(VPC)、本地 IDC 網路(規劃中)。

經典網路:統一部署在阿里雲的公共基礎網路內,網路的規劃和管理由阿里雲負責,更適合對網路易用性要求比較高的客戶。

專有網路:基於阿里雲構建出一個隔離的網路環境。您可以完全掌控自己的虛擬網路,包括選擇自有的 IP 地址範圍,劃分網段,以及配置路由表和閘道器。

本地 IDC 網路:您自身構建機房的網路環境,與阿里雲網路是隔離不可用的。

持且僅支援結構化(例如 RDS、DRDS 等)、半結構化、無結構化(OSS、TXT 等,要求具體同步資料必須抽象為結構化資料)的資料同步。換言之,Data Integration 支援傳輸能夠抽象為邏輯二維表的資料同步,其他完全非結構化資料,例如 OSS 中存放的一段 MP3,Data Integration 暫未支援將其同步到 MaxCompute,這個功能會在後期實現。


相關文章