入職一年半,這個AI員工晉升為了國內首位AI架構師

机器之心發表於2024-08-08
你敢想,AI 已經不滿足只做程式設計師了,如今又向架構師這一進階職業發起挑戰。

隨著 AI 在研發領域的不斷進化,能提供給工程師的助力越來越多,從原先單純的編碼加速器不斷延展到架構理解、質量分析、安全掃描、測試生成等更多領域。同時結合 RAG 技術的不斷落地應用,對私域知識、本地場景的深刻理解,AI 程式碼助手的能力邊界正在不斷被打破。

年初,英偉達創始人、CEO 黃仁勳的一番話引發了計算機行業內外的熱議。他表示:「生成式 AI 的持續發展大大降低了學習程式設計的意義,未來人人都可以成為程式設計師。」無獨有偶,百度創始人、CEO 李彥宏也在一次訪談中指出,「這波人工智慧的改變可能更加徹底和深刻,基本上以後不會再存在程式設計師這種職業了。只要會說話,人人都會具備程式設計師的能力。」

兩位科技大佬的觀點倒不是說未來程式設計師都會失業,而是在 AI 的幫助下,更多研發行業中非程式設計師的角色也可以具備基本的開發程式的能力,而具備專業技能的軟體工程師們在 AI 助力下將發揮更大的價值。

同時,兩位科技大佬的觀點一定程度上揭示了一個重要趨勢:隨著大模型賦能的 AI 程式碼助手在企業業務場景的應用落地,AI 輔助所佔的比重越來越高。Stack Overflow 2024 開發者調查報告顯示,76% 的受訪者正在或計劃在開發過程中使用 AI 工具,有好感或非常有好感的比例達到了 72%。

國內外大廠都在 AI 程式碼助手這一賽道重兵投入,而率先入局者已經在自身業務中初見成效,比如百度內部已經有 30%的程式碼由其智慧程式碼助手「文心快碼 Baidu Comate」生成

說到文心快碼(Baidu Comate),它還是在 6 月底百度 WAVE SUMMIT 深度學習開發者大會上擁有了自己的中文名,並升級到了 2.5 版本。算起來,自 2023 年 4 月推出以來,文心快碼已經是一位「練習時長快一年半」的 AI 程式設計師了。
在崗這麼長時間,文心快碼現已支援了 C/C++、Java 等 100 多種程式語言和 VS Code、Jetbrains 系列等 19 款主流 IDE 平臺,能夠續寫已有程式碼、利用自然語言指令生成程式碼、根據註釋寫程式碼並在程式碼基礎上生成註釋。我們觀察到,百度內部已經有 80%的工程師在深度使用文心快碼。
而隨著基礎模型能力的持續提升以及 AI 程式碼助手在工作中越來越駕輕就熟,其自身能力也在不斷進化。這不,百度文心快碼不滿足只幹程式設計師的活了,它表現出來的一些能力正在告訴人們:自己甚至可以勝任架構師的角色了

不過,在揭秘文心快碼的「進階能力」之前,我們有必要先來了解一下程式設計師與架構師的區別。

AI 程式設計師的職業晉升
做專才更要通才

如果說程式設計師是某一技術領域的專才(如前端、後端、移動應用開發),架構師則可以稱得上多個技術領域的通才了,他們要在軟體開發、系統架構、網路通訊、資料庫設計等方面都玩得轉。

從職能上看,程式設計師側重於在實現層面執行編寫程式碼、除錯與測試、維護等具體任務,而架構師主要負責整體系統的設計和規劃,包括系統架構、模組劃分、技術選型等,還要做出技術決策並指導團隊。

因此,程式設計師晉升為架構師需要全方位的提升。同樣地,AI 程式碼助手要想成功地將自身角色從程式設計師跨越到架構師,必然要在承擔的職責、具備的技能方面更上一個臺階。

文心快碼既然宣稱升級成為了「網際網路首位 AI 架構師」,想必已經掌握了承擔相應角色與任務的必備技能。

自落地百度內部以來,文心快碼在完成常見程式設計任務方面自不必多說,程式碼採納率也達到了 46%。隨著向架構師角色的轉變,如今的文心快碼更懂業務架構、更懂測試、更懂領域知識、更能解決程式碼程式設計中的疑難問題

首要一點便是能更高效地解決程式設計中的架構問題,它們往往涉及到系統的層次結構、模組劃分、控制流和資料流等方面。人類架構師統籌起來尚且不容易,而文心快碼在擁有了架構師的能力後,可以透過程式碼解釋,快速瞭解函式在「真實業務背景下的含義」。

不僅如此,為了更清楚地洞見程式設計邏輯框架、專案管理全流程,文心快碼還能透過流程圖的方式,直觀地展示完整的呼叫邏輯圖片
其次程式碼質量也是架構師關注的關鍵領域,而單元測試(UT)則是保障程式碼質量的關鍵舉措,以確保系統穩定性和可靠性。文心快碼在單元測試生成方面迎來全面強化,不僅 UT 生成效果大幅提升,生成的 UT 用例更是達到了 100% 有效。

做到這些要歸功於文心快碼自動識別工程所使用的測試框架版本,它能夠自動識別被測方法跨檔案依賴,並自動參考已有單元測試書寫風格,因而可以生成更貼近真實場景、效果更優、可用性更強的單元測試程式碼。

同時得益於文心快碼四層架構的 AI 最佳化,UT 生成速度同樣大幅提升。即使面對複雜的函式,平均 6 秒就能自動生成可用單元測試,縮短了等待載入時間。入職一年半,這個AI員工晉升為了國內首位AI架構師
在 UT 生成效果和速度得到加強之外,文心快碼還支援批次生成 UT,實現了質、速和量的三合一提升。

面對紛繁複雜的變更函式以及堆積成山的歷史程式碼,文心快碼可以針對目錄、多檔案、單檔案等多型別一鍵發起生成,並做到生成、驗證和修復同步進行,確保 UT 用例的有效可靠。

圖片

此外,對於找到並修復程式中的錯誤或缺陷,文心快碼做到了更好、更快。只需要選中報錯的日誌,然後交給文心快碼進行對比分析和修復,它會自動給出錯誤原因和錯誤修復方式,一目瞭然。同時也可以進行多輪 Debug,只要一句話,便能解決研發過程中遇到的各種疑難問題。

圖片

如果以百度自身對架構師的定義來評判文心快碼如今的表現,可以說它從業務理解、程式碼能力、文件編寫和技術視野四個維度得到了全方面加強,並提供了一系列相應的自動化服務。

當文心快碼這樣的 AI 程式碼助手開始從架構師的角度來思考並解決問題時,勢必會對包括提出需求、編寫程式碼、測試與釋出、檢測潛在 bug 與安全漏洞在內的整個開發流程帶來更大增益,進一步提升業務迭代速度。

當然,工欲善其事必先利其器。文心快碼進化到擁有架構師的能力並不是一蹴而就,而是各方面因素綜合作用的結果。

進化的背後
是多點發力

我們知道,文心快碼背後是文心大模型提供動力,前不久剛剛升級到 4.0 Turbo 版本。透過更大訓練資料體量、更優資料分佈與質量、更強訓練演算法,文心大模型在理解、邏輯推理層面再次躍升。

可以說,更強大文心大模型為文心快碼的又一次「變身」提供了理論上的可能和堅實基礎。

在此之外,文心快碼在高質量訓練資料集、專家參與的知識體系、私域知識增強以及精調和最佳化方面形成了獨有優勢。

首先是在資料層面「做深文章」。資料作為 AI 三大要素之一,對模型訓練效果的作用舉足輕重。文心快碼擁有充足且高質量的訓練資料集,涵蓋了百度內部嚴格篩選的優秀程式碼資料集以及 GitHub、GitLab 等外部主流開原始碼庫資源,最大程度實現預訓練資料的多樣性和豐富性。

因此,有了更多、更全、更優質的資料支撐,文心快碼才能更加深入理解和學習不同的程式語言、框架及真實業務場景下的編碼規律。

其次在構建知識體系的過程中做到了雙管齊下。不斷吸收並學習知識是提升 AI 理解、推理和決策能力,並在實際應用中更加精準和高效的關鍵因素。

一方面,透過由語言、框架、知識集等多個維度的專家團隊的共同努力,整理並構建了由上萬個知識集組成的專家知識體系,在覆蓋基礎語法、資料結構等通用知識之外,還深入到了特定框架、庫及業務場景的高階應用,實現通用與專用知識的結合。

另一方面是增強了私域知識。在關注外部客戶業務需求的基礎上,文心快碼為他們提供了基於 RAG 技術的資料檢索增強功能,提升在具體業務場景中的生成能力和準確性。同時完善評估與持續最佳化機制,在上線後也能根據客戶反饋及時處理和調整,適應他們可能變化的業務狀況和需求,形成資料、效果、產品功能和應用實踐一整個鏈條的快速反饋迭代。

最後是注重精調與最佳化。這一點在百度內部尤為明顯,有了對上萬工程師研發實踐以及內部使用者使用習慣和需求的充分了解,利用類似 DPO(資料驅動最佳化)的技術手段對內部程式碼資料進行深入分析,構建了反映使用者真實需求的專用資料集。同時在不斷迭代和最佳化過程中形成資料飛輪效應,持續指導模型精調。

至此,在底層模型的加持之外,文心快碼進階到 AI 架構師完成了資料、知識、精調與最佳化多層面的技術和實踐準備。

目前,文心快碼已經收穫了多領域大量客戶的認可,並已在喜馬拉雅、數蓬科技、南威軟體、華農保險等企業的應用中提升了研發效率,為其業務發展和技術創新注入了新的強大動力。

寫在最後

從微軟推出 Copilot 程式設計助手到雨後春筍般湧現的程式碼大模型及智慧程式碼助手、再到今年首位 AI 軟體工程師 Devin 的誕生,AI 進化的速度實在令人驚歎。

這一方面要看到 AI 程式碼助手的應用潛力。根據《Gartner 2024 年十大戰略技術趨勢》預測,到 2028 年,75% 的企業軟體工程師將使用 AI 編碼助手,這一比例在 2023 年初還不足 10%。因此,在需求趨勢驅動下,AI 程式碼助手持續「修煉內功」是必然的。

此次百度文心快碼在職能上向架構師的延伸,正是這一趨勢的體現,也意味著對程式設計領域的影響越來越深入,逐漸地從單一的程式設計任務滲透到整個研發全生命週期並有可能重構研發正規化。

可以預見,在未來相當長的一段時間裡,AI 程式碼助手會強勢存在並不斷進化。對於程式設計甚至更高層次的架構設計工作而言,助力將會越來越大。到時候,工程師們將不會被繁瑣的工作所牽絆,效率加倍,留出更多的時間去享受生活。

這兩天衝上熱搜的太原理工 2024 軟體工程專業招生近 2000 人,也從側面說明軟體工程師這一職業仍有巨大前景。而且我們瞭解到,該專業所屬的軟體學院還是首批使用文心快碼的機構之一,可見新技術已經與未來的軟體研發生力軍在建立了聯絡。

因此,關鍵在於如何在理念和實踐中利用好 AI。正如史丹佛著名學者 Erik Brynjolfsson 所言,企業應該將 AI 視為員工的合作伙伴,而非競爭對手。程式設計師要讓 AI 處理它們擅長的重複、繁瑣和機械的事情,自身則專注於那些能夠發揮核心價值的創造性工作。

以百度為例,它在開發文心快碼的過程中彙集了數萬工程師的實踐經驗,形成三大「人機協同價值觀」,包括 AI 不會取代你但會 AI 的人將在職業市場上更具有競爭力,人機協同的關係中人始終處於 Control 的地位和人機協同、共同進化,可以為人機和諧相處提供一定借鑑。

未來,隨著 AI 程式碼助手扮演的角色越來越強大,勝任的任務越來越多,其與人的共存將會是一個長期命題,需要包括百度在內的各方匯聚智慧來正確對待和解決。

點選「此連結」體驗文心快碼,獲取你的專屬AI架構師。

相關文章