Sqoop是什麼
Sqoop:SQL-to-Hadoop 連線 傳統關係型資料庫 和 Hadoop 的橋樑 把關係型資料庫的資料匯入到 Hadoop 系統 ( 如 HDFS HBase 和 Hive) 中; 把資料從 Hadoop 系統裡抽取並匯出到關係型資料庫裡。 利用MapReduce加快資料傳輸速度 :將資料同步問題轉化為MR作業 批處理方式進行資料傳輸:實時性不夠好
Sqoop優勢
高效、可控地利用資源 任務並行度,超時時間等 資料型別對映與轉換 可自動進行,使用者也可自定義 支援多種資料庫 MySQL Oracle PostgreSQL
Sqoop import
將資料從關係型資料庫匯入Hadoop中 步驟1:Sqoop與資料庫Server通訊,獲取資料庫表的後設資料資訊; 步驟2:Sqoop啟動一個Map-Only的MR作業,利用後設資料資訊並行將資料寫入Hadoop。 特點:可以指定hdfs路徑,指定關聯式資料庫的表,欄位,連線數(不壓垮資料庫),可以匯入多個表,支援增量匯入(手動指定起始id、事件,或自動記錄上次結束位置,自動完成增量匯入)
Sqoop Export
將資料從Hadoop匯入關係型資料庫導中 步驟1:Sqoop與資料庫Server通訊,獲取資料庫表的後設資料資訊; 步驟2:並行匯入資料: 將Hadoop上檔案劃分成若干個split; 每個split由一個Map Task進行資料匯入。
Sqoop與其他系統結合
Sqoop可以與Oozie、Hive、Hbase等系統結合; PS:
將來自己,一定會感謝現在自己的,現在不努力,將來只會後悔。我們不做後悔的哪個,只做最好的自己。
關注本公眾號,在公眾號後臺點選“領取資料”都可以獲取免費學習視訊,下方是公眾號二維碼,掃掃就可以關注了。
想從事以上工作或者往大資料方向發展的朋友,可以點選聯絡我們,獲取大資料相關資料和高清學習線路圖,希望在你發展的道路上有所幫助。
複製程式碼