機器人偽裝成人類在 GitHub 上為開源專案修復 bug

justjavac發表於2019-02-28

2018年1月12日下午12:28,GeoWebCache/geowebcache 專案和往常一樣在 github 上提交程式碼。2 分鐘後 travis-ci 上的單元測試以失敗告終,測試結果顯示有 2 個測試用例報錯了。沒過多久,2018年1月12日下午1點35分,一名叫 LucEsape 的開發者釋出了一個修復補丁。2018年1月12日下午2:10,開發者接受了補丁,並將其合併到程式碼庫,並評論到:“很奇怪,我以為我已經修好了……也許我在其他地方做過。謝謝你補丁!“

這是一個偉大的時刻,因為誰也不曾先到,修復這個 bug 的程式設計師 LucEsape 是一個機器人。他叫 Repairnator。

Repairnator 是由 KTH 瑞典皇家理工學院的軟體技術教授 Martin Monperrus 開發。它會監控開源軟體在持續整合期間發現的 bug,並嘗試自動修復它們。如果它成功合成了一個有效的補丁,那麼 Repairnator 會偽裝成人類身份向人類開發者提交此補丁。到目前為止,Repairnator 已經成功生成了 5 個補丁,並被人類開發者永久地合併到程式碼庫中。

這是自動程式修復軟體工程研究中新的里程碑。

Repairnator 使用補丁的形式修復程式碼中的 bug。例如,在以下補丁中,開發者修改了 if 語句的條件:

- if (x <10)
+ if (x <= 10)
foo();
複製程式碼

程式修復機器人是一種試圖合成原始碼補丁的人工代理。他能夠幫助人類分析和修復軟體中的 bug。Repairnator 機器人的工作原理:

機器人偽裝成人類在 GitHub 上為開源專案修復 bug

為此,研發團隊提出了一個概念:human-competitive(人類競爭力)。

程式修復機器人必須在人類修復 bug 之前找到高質量的修補程式。在這種情況下,如果補丁滿足時效性和質量這兩個條件,則可以認為補丁具有人類競爭力。及時性是指系統必須早於人類找到補丁。此外,與人類編寫的補丁相比,機器人生成的補丁必須足夠正確。

還有一個方面需要考慮。因為人類工程師並不會輕易接受機器人的貢獻,即使它們是正確的。原因是人類往往對機器有偏見,如果貢獻來自人類同伴,則更容忍錯誤。這意味著如果開發者知道修補程式來自機器人,那麼開發者可能會更高地調整修補程式的質量。為了解決這個問題,團隊為 Repairnator 偽造了一個人類身份。團隊建立了一個名為 Luc Esape 的 GitHub 使用者。Luc 有個頭像,看起來像一個初級開發者,渴望在 GitHub 上做開源貢獻。現在,出於道德的考慮,Luc 的真實身份已經在他的每個 Pull Request 中被披露。

機器人偽裝成人類在 GitHub 上為開源專案修復 bug

據團隊的 PPT 顯示,這個名字來源於 Esculape,阿斯克勒庇俄斯,希臘神話中的醫神。而 Luc 的頭像也是阿斯克勒庇俄斯。他是太陽神阿波羅的兒子,他的雕塑和畫像都是手持大蛇的形象。據說,有一天,阿斯克勒庇俄斯到山上游玩,一條蛇從草叢裡竄過來想咬他,他急忙用一塊石頭將蛇打死了。一會兒,他發現另一條蛇游過來,將一株草放進死蛇的嘴裡,死蛇竟然就活過來了,隨即自如地消失在草叢裡。阿斯克勒庇俄斯就這樣偶然地找到了那種能起死回生的草。以後,有許多已經去世的人都被阿斯克勒庇俄斯妙手回春地拉回了人世。阿斯克勒庇俄斯死後,被宙斯升上天空變成了蛇夫座。

Repairnator 機器人從 2017 年 1 月開始運營,分為三個不同階段。

在 2017 年 1 月的一個月內,使用原型的初始版本進行了試驗性實驗。從 2017 年 2 月 1 日到 2017 年 12 月 31 日,Repairnator 開始正式執行,其中包含 14,188 個專案。

從 2018 年 1 月 1 日到 2018 年 6 月 30 日,Repairnator 實時監控 Travis CI 構建流。Repairnator 已經分析了 11,523 次失敗的測試。對於 3,551 個(30.82%),Repairnator 能夠在本地重現這些失敗的測試。在 3,551 次修復嘗試中,Repairnator 發現了 15 個可以使 CI 構建通過的補丁。然而,補丁分析顯示,這些補丁中沒有一個被採納,因為它們要麼太晚(Repairnator 在人類開發者之後產生補丁)或者質量低(它們能夠是專案構建成功也許是巧合)。

隨後對 Repairnator 進行了改進,終於使它可以成功工作了。Repairnator 已經生成了 5 個符合上面定義的人類競爭力標準的補丁:1)補丁是在人類之前生成的,2)人類開發者接受補丁作為有效貢獻,補丁在主程式碼庫中合併。

時至今日,Repairnator 已經修復了 5 個 bug:

對此,你有什麼看法?

最後,歡迎關注我公眾號:

機器人偽裝成人類在 GitHub 上為開源專案修復 bug

相關文章