阿里OSS Select
最近阿里的select object在公測,但是暫時只有Java和Python的sdk,所以擼了一個go的sdk,有需要的可以看看。
github: https://github.com/killernova/goossselect
關於 Select Object
物件儲存(Object Storage Service,簡稱OSS) 是基於阿里雲飛天分散式系統的海量、安全和高可靠的雲端儲存服務,是一種面向網際網路的大規模、低成本、通用儲存,提供RESTful API,具備容量和處理的彈性擴充套件能力。OSS不僅非常適合儲存海量的媒體檔案,也適合作為資料倉儲儲存海量的資料檔案。目前Hadoop 3.0已經支援OSS,在EMR上執行Spark/Hive/Presto等服務以及阿里自研的MaxCompute、HybridDB以及新上線的Data Lake Analytics都支援從OSS直接處理資料。 然而,目前OSS提供的GetObject介面決定了大資料平臺只能把OSS資料全部下載到本地然後進行分析過濾,在很多查詢場景下浪費了大量頻寬和客戶端資源。 SelectObject介面是對上述問題的解決方案。其核心思想是大資料平臺將條件、Projection下推到OSS層,讓OSS做基本的過濾,從而只返回有用的資料。客戶端一方面可以減少網路頻寬,另一方面也減少了資料的處理量,從而節省了CPU和記憶體用來做其他更多的事情。這使得基於OSS的資料倉儲、資料分析成為一種更有吸引力的選擇。 SelectObject現在處於公測階段,提供了Java、Python 的SDK。目前支援RFC 4180標準的CSV(包括TSV等類CSV檔案,檔案的行列分隔符以及Quote字元都可自定義),且檔案編碼為UTF-8。支援標準儲存型別和低頻訪問儲存型別的檔案。支援加密檔案(OSS完全託管、KMS加密-預設KMS主金鑰)。 支援的SQL語法如下: SQL 語句: Select From Where 資料型別:String, Int(64bit), float(64bit), Timestamp, Boolean 操作: 邏輯條件(AND,OR,NOT), 算術表示式(+-*/%), 比較操作(>,=, <, >=, <=, !=),String 操作 (LIKE, || ) 和GetObject提供了基於Byte的分片下載類似,SelectObject也提供了分片查詢的機制,包括兩種分片方式:按行分片和按Split分片。按行分片是常用的分片方式,然而對於稀疏資料來說,按行分片可能會導致分片時負載不均衡。Split是OSS用於分片的一個概念,一個Split包含多行資料,每個Split的資料大小大致相等,相對按行來,按Spit是更加高效的分片方式。尤其是對於CSV資料來說,基於Byte的分片可能會將資料破壞,因此按Spit分片更加合適。
具體可以參考阿里的官方文件: https://help.aliyun.com/document_detail/74054.html?spm=a2c4g.11174283.6.939.CITRtK
相關文章
- 阿里雲oss配置:阿里
- 阿里oss multipartUpload 錯誤阿里
- android 阿里雲oss上傳Android阿里
- 阿里雲圖床(PicGo+阿里雲OSS)搭建阿里圖床PicGo
- jquery阿里雲oss 分片上傳jQuery阿里
- Laravel 使用阿里雲 oss 儲存物件Laravel阿里物件
- 蘋果CMS 阿里雲OSS外掛蘋果阿里
- flutter---->阿里雲oss的外掛Flutter阿里
- 阿里雲OSS專案搭建筆記阿里筆記
- 阿里雲 oss 檔案上傳 小坑阿里
- vue 圖片上傳到阿里雲ossVue阿里
- 阿里雲CDN+OSS完成圖片加速阿里
- Flutter 上傳圖片到阿里雲OSSFlutter阿里
- 阿里雲物件儲存OSS支援版本管理特性阿里物件
- 小程式上傳圖片到阿里雲oss阿里
- 阿里雲 OSS 簽名上傳(結合 elementUI)阿里UI
- flutter直接上傳檔案到阿里雲ossFlutter阿里
- 圖片裁剪並上傳到阿里雲oss阿里
- 阿里雲OSS雲端儲存管理實踐阿里
- vue 阿里雲oss下載檔案,自定義命名Vue阿里
- Android圖片上傳到阿里雲OSS小案例Android阿里
- 【保姆級】阿里雲OSS+PicGo+Typora搭建圖床阿里PicGo圖床
- 最佳實踐:使用阿里雲CDN加速OSS訪問阿里
- 使用Typora + 阿里雲OSS + PicGo 打造自己的圖床阿里PicGo圖床
- 阿里雲物件儲存OSS及CDN加速配置阿里物件
- Fusion Upload元件 對接 阿里雲OSS/七牛/又拍元件阿里
- 使阿里oss實現前端程式碼自動上傳阿里前端
- Springboot 遷移及上傳檔案至阿里雲OSSSpring Boot阿里
- Spring Boot 整合阿里雲 OSS 進行檔案儲存Spring Boot阿里
- SpringBoot使用阿里OSS實現檔案雲端儲存Spring Boot阿里
- 前端(react)上傳到阿里雲OSS儲存 例項前端React阿里
- 【故障公告】阿里雲OSS故障造成圖片無法上傳阿里
- 前端使用 JS 上傳圖片至阿里雲 ali-oss前端JS阿里
- 深夜福利,晚點分享一個上傳阿里雲 OSS 元件阿里元件
- Sts 授權直傳阿里雲 OSS-.net core實現阿里
- 實戰 | 將Apache Hudi資料集寫入阿里雲OSSApache阿里
- Laravel5.6 + 阿里雲 OSS 完成圖文分離架構Laravel阿里架構
- 易優CMS阿里雲OSS上傳圖片報錯-eyoucms阿里