支援“中國芯”,極狐GitLab助力AI晶片企業DevOps體系建設

陳笑笑長大了發表於2021-09-11

根據Forrester預測,全球AI製造平臺產值到2025年將達到130億美元。並將成AI軟體第一大細分市場。AI晶片行業正在全球迎來春天。據研究機構賽迪顧問報告顯示,從2019年到2021年三年中國AI晶片市場規模一直保持50%以上的增長速度,到2021年,市場規模將達到305.7億元。


面對如此誘人的市場規模和不斷變化的市場需求,即便AI晶片行業已經巨頭林立,依然有眾多優秀並且敢於創新的新生力量進入賽道,在極速發展中佔有行業的一席之地,“燧原科技”便是其中不得不提的名字。


近日,極狐(GitLab)採訪到來自國內AI晶片行業代表企業——燧原科技的軟體研發總監張文平先生,與您分享這家優秀的AI晶片企業數字化基礎設施的升級之路。

尋找堅實的數字力護航產品研運體系


張文平表示:“燧原科技專注研發人工智慧領域雲端算力平臺,在整個研發程式中,既包括AI晶片與板卡的設計、開發、測試、量產,也包括AI軟體棧及相關工具鏈的設計、開發、驗證、測試等各個環節。”


AI晶片本身的諸多特性需要先進的晶片架構以及易用並持續迭代的軟體棧一起來保證。相較於純軟體企業的開發流程,燧原科技更具挑戰的是整個研發流程,既有Pre-Silicon階段的軟體模擬平臺、物理模擬平臺的開發驗證流程,又有Post-Silicon晶片、板卡、伺服器系統以及AI叢集等多種開發驗證環境。因此燧原科技過去一直在使用組合工具鏈來打造研發流程。


燧原科技的研發團隊使用不同工具來滿足不同研發要求,例如程式碼託管平臺GitLab、製品管理平臺Artifactory、測試管理平臺TestRail等等各類優秀的工具、並且使用Gerrit/Jenkins/GitLab CI持續整合Pipeline。


然而,複雜的組合工具鏈在整合過程中,一直面臨穩定性與可擴充套件性等問題。同時如何整合各種相關工具使其高效、可持續地工作,確保產品研發等各環節高質量的完成交付工作,燧原科技正在尋求突破的方向。


另一方面,燧原科技在國內上海、北京、深圳、杭州都設有辦公室,不同地點的研發人員協同效率問題也是研發團隊持續面臨的問題,尤其是隨著程式碼倉庫的增大,程式碼倉庫在託管平臺不同地點之間的同步也遇到挑戰。


張文平表示:


燧原科技從成立的第一天開始就在使用GitLab社群版產品,但是免費的社群版產品功能隨著公司的快速成長,已不再能夠滿足燧原科技對研發效率的追求,希望利用更多高階的增值功能並結合燧原內部的研發場景,構建敏捷、穩定、高效以及可擴充套件的研發流程。在得知極狐(GitLab)公司成立後,我們對極狐GitLab專業版的功能進行了深入的調研,並對於極狐GitLab本土化支援的實時性、專業支援能力和運維能力有了充分了解,最終選擇極狐GitLab專業版在燧原內部進行落地部署。在產品落地部署的同時, 極狐GitLab所提供的線上課程以及豐富詳細的說明文件讓燧原科技的R&D和DevOps工程師能快速地學習、成長。


星火燎原,優秀DevOps體系的試驗田


張文平表示:“ 極狐GitLab專業版的引入,從DevOps的運維角度,降低了運維的難度和複雜性,同時也提高了研發體系的可靠性和工程效率,從而進一步提高研發和運維人員的研發體驗。”


燧原科技十分清醒的認識到,DevOps體系大規模的改革並非一蹴而就,全面展開調整之前需要進行不斷的論證、嘗試和迭代,找到專屬於燧原科技的DevOps體系化之路,才是正確的開啟方式。


張文平說:“我們使用極狐GitLab專業版目前是從部分團隊開始,期待未來可以大規模推廣到更多團隊。”

 

01


提升研發效率,統一工具平臺


燧原科技亟待減少獨立工具種類以搭建統一的、高效的DevOps平臺以提升整體研發運維效率。


目前,燧原科技部分產品研發團隊已經完成在極狐GitLab中研發流程的遷移,經過改進後,實現了單一平臺的協作並且無需跳轉。同時本地就近服務節點Clone/Commit程式碼,加速程式碼拉取操作,同時與K8s算力叢集對接,簡化程式碼提交、review流程的同時,實現CI pipeline的簡化和高效執行。(資料來源:極狐GitLab使用情況展示)


隨著燧原科技的規模發展,公司研發團隊在物理位置上的分散,也出現了一些協作方面的挑戰,比如其他城市的團隊在檢出程式碼時(極狐GitLab例項安裝在上海的伺服器上),受限於頻寬和程式碼庫大小,耗時較多。在採用了極狐GitLab GEO部署方式後,程式碼檢出速度大大縮短,有效的提升了研發效率。(資料來源:極狐GitLab GEO部署展示)


另一方面,燧原科技也正在使用極狐GitLab的Group/Subgroup等功能對專案做更細粒度的劃分管理,這也使得燧原科技對於原始碼管理的安全性得到了有效的提升。


02


最佳化生產成本,團隊效能倍增


張文平說:“燧原科技利用極狐GitLab專業版降低工具平臺的維護難度與成本,節約了運維時間成本,從而可以花更多精力專注在有創造性的工作內容上。”


燧原科技在前期僅僅將極狐GitLab作為原始碼管理工具,而整體的CI/CD是用Jenkins來完成的。眾所周知,Jenkins功能強大且較為穩定,但是大量的Jenkins外掛維護對研發人員來講是不小的工作量,外掛之間還有版本依賴。隨著燧原科技的專案複雜度和規模都在不斷擴大,導致Jenkins例項數量的持續增加,如何保證不同環境(開發、測試以及生產)的Jenkins例項的配置、外掛版本等保持一致,同時在人力有限的情況下,能夠達成這樣的工作體量,成為張文平團隊需要考慮的下一個問題。


另外一方面,Jenkins支援多種語言來完成CI/CD,如Shell, Groovy, Python等。往往負責CI/CD編排和負責業務研發的員工是兩個團隊,這在無形中會增加溝通成本,阻礙DevOps的高效執行。(資料來源:極狐GitLab Pipeline流程展示)


當燧原科技開始使用極狐GitLab + 極狐GitLab CI的方式後,開發人員可以透過檢視極狐GitLab CI的語法來完成CI/CD的編排,這樣就省去了無窮無盡的各類外掛更新和例項維護,同時CI/CD編排團隊的額外溝通成本也得到有效控制。

 

03


更好的使用者體驗,推動快速落地


研發運維的工具需要創新,使用更具創新性的DevOps平臺,提升員工工作體驗,減少繁瑣的重複和等待,可以幫助提高員工的工作效率。


對於研發人員來講,改變現有的研發習慣,擁抱新的變化是需要過程的。張文平認為:“逐步培養研發人員使用更新、更高效的研發運維工具非常重要。一個好產品,肯定具有一定的使用者粘性,研發人員一旦感受新工具、新平臺帶來簡潔、方便、高效的特性和改變,他們將會樂意接受並融入。”


未來可期,打造更安全的DevOps體系


張文平認為:“任何生產力工具的落地,都需要一個迭代過程,我們對極狐GitLab在很多方面都有期待和想法,未來我們會在極狐GitLab中探索更多功能的使用,並在合適的時間點進一步完善體系的搭建,例如整合極狐GitLab內建的安全功能等。”


成立3年,高歌猛進。燧原科技以行業黑馬的姿態在AI晶片領域開疆拓土。在近期活動中,燧原科技打出了“算力普惠之智,晶片強國之夢”的口號,這背後需要其搭建迭代更快、效率更高、能力更強的數字化基礎設施體系,來支撐更長遠的發展。未來,極狐(GitLab)會持續提供高質量、高品質的產品與服務助力燧原科技早日實現“晶片強國之夢”。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31545225/viewspace-2791621/,如需轉載,請註明出處,否則將追究法律責任。

相關文章