1. 介紹
經過Apache Hudi專案委員會討論及投票決定,來自阿里雲的Pengzhiwei和DannyChan成為Apache Hudi Committer,新晉人才也保證了Hudi社群在正確的軌道上不斷髮展。
Pengzhiwei持續在Apache Hudi社群貢獻,開發了諸多特性,如Spark SQL整合Hudi,該功能降低了使用者使用Hudi的門檻,SQL化操作讓資料入湖更加順滑,還貢獻了Spark流式讀取Hudi表,Spark FileIndex等一系列Spark側的特性,同時在Github Issue、Hudi中國微信群積極回答使用者各種問題,Pengzhiwei是一個非常好的團隊協作同學,Pengzhiwei具有多年流計算SQL引擎開發經驗,目前主要負責資料湖格式以及實時入湖方面的研發工作。
Danny Chan也貢獻了非常多的特性,主要集中在Flink與Hudi的整合,包括新的無阻塞的Flink寫入鏈路,Flink流和批讀Hudi表(COW和MOR),以及實現了Hudi Flink SQL Connector(讀和寫),極大方便了資料入湖。同時Danny也積極回答使用者的各類問題,同時也輸出了Flink與Hudi整合指南,並且開了一場Flink整合Hudi的直播,DannyChan目前專注於Flink與Hudi的整合。
2. 社群
隨著AWS、阿里巴巴等世界頂級雲廠商內建Hudi為資料湖基礎設施,賦能世界範圍內成千上萬公司,基於Hudi構建事務型實時資料湖平臺,以Lakehouse架構賦能AI和BI等典型的大資料場景,驅動企業數字化轉型。
Apache Hudi社群在不斷髮展壯大,微信群/社群Slack/郵件列表非常活躍,討論也非常開放,隨著Hudi被越來越多公司熟知和使用,也吸引全球越來越多的小夥伴參與到社群中,對華人非常友好,其中來自國內開發者的聲音越來越大,也歡迎一起更多國內小夥伴一起參與社群,讓你的程式碼創造世界範圍的影響力。
3. 如何參與
如果你想參與Hudi社群但還不瞭解如何參與,可參考如下兩篇文章:
持續參與社群貢獻,如特性開發、bugfix、Code Review、回答使用者問題、積極參與討論、推廣Hudi等,Committer便水到渠成,行動起來,下一個Committer可能就是你。
4. 最後
再次恭喜Pengzhiwei和DannyChan,一起打造更好的資料湖平臺。
Apache Hudi專案github地址:https://github.com/apache/hudi,歡迎fork & star