機器學習免費跑分神器:整合各大資料集,連線GitHub就能用,還能驗證

suliver發表於2021-09-09
栗子 魚羊 發自 凹非寺
量子位 報導 |

搞機器學習的小夥伴們,免不了要在各種資料集上,給AI模型跑分。

現在,Papers with Code (那個以論文搜程式碼的神器) 團隊,推出了自動跑分服務,名叫sotabench,以跑遍所有開源模型為己任。

有了它,不用上傳程式碼,只要連線GitHub專案,就有云端GPU幫你跑分;每次提交了新的commit,系統又會自動更新跑分。還有世界排行榜,可以觀察各路強手的成績。

圖片描述

除了支援各大主流資料集,還支援使用者上傳自己的資料集。

也可以看看,別人的論文結果,到底靠譜不靠譜。

比如說,fork一下Facebook的FixRes這個專案,配置一下評估檔案:

圖片描述

然後一鍵關聯,讓Sotabench的GPU跑一下ImageNet的影像分類測試。

就能得到這樣的結果:

圖片描述

Top-1準確率,Top-5準確率,跟論文的結果有何差距(見注),執行速度,全球排名,全部一目瞭然。

注:ε-REPR,結果與論文結果差距在0.3%以內時打勾,差距≥0.3%且比論文結果差顯示為紅叉,比論文結果好顯示為勾+

這個免費的跑分神器,釋出一天,便受到熱烈歡迎:推特點贊600+,Reddit熱度270+。

圖片描述

網友紛紛表示:這對開發者社群來說太有用了!

那麼,先來看一下sotabench的功能和用法吧。

用法簡單,海納百川

團隊說,sotabench就是Papers with Code的雙胞胎姐妹:

Papers with Code大家很熟悉了,它觀察的是論文報告的跑分。可以用來尋找高分模型對應的程式碼,是個造福人類的工具。

圖片描述

與之互補,sotabench觀察的是開源專案,程式碼實際執行的結果。可以測試自己的模型,也能驗證別家的模型,是不是真有論文說的那麼強。

它支援跟其他模型的對比,支援檢視速度和準確率的取捨情況。

那麼,sotabench怎麼用?簡單,只要兩步。

第一步,先在本地評估一下模型:

在GitHub專案的根目錄裡,建立一個sotabench.py檔案。裡面可以包含:載入、處理資料集和從中得出預測所需的邏輯。每提交一個commit,這個檔案都會執行。

然後,用個開源的基準測試庫來跑你的模型。

這個庫可以是sotabench-eval,這個庫不問框架,裡面有ImageNet等等資料集;也可以是torchbench,這是個PyTorch庫,和PyTorch資料集載入器搭配食用更簡單。

圖片描述

一旦成功跑起來,就可以進入下一步。

第二步,連線GitHub專案,sotabench會幫你跑:

圖片描述

點選這個按鈕,連到你的GitHub賬號,各種專案就顯現了。選擇你要測試的那個專案來連線。

連好之後,系統會自動測試你的master,然後記錄官方結果,一切都是跑在雲端GPU上。

測試環境是根據requirement.txt檔案設定的,所以要把這個檔案加進repo,讓系統捕捉到你用的依賴項。

從此,每當你提交一次commit,系統都會幫你重新跑分,來確保分數是最新的,也確保更新的模型依然再工作。

這樣一來,模型出了bug,也能及時知曉。

圖片描述

如果要跑別人家的模型,fork到自己那裡就好啦。

目前,sotabench已經支援了一些主流資料集:

圖片描述

列表還在持續更新中,團隊也在盛情邀請各路豪傑,一同充實benchmark大家庭。

既支援建立一個新的benchmark,也支援為現有benchmark新增新的實現。

你可以給sotabench-eval或torchbench專案提交PR,也可以直接建立新的Python包。

一旦準備就緒,就在sotabench官網的論壇上,釋出新話題,團隊會把你的benchmark加進去的:

圖片描述

好評如潮

這樣的一項服務推出,網友們紛紛點贊,好評如潮,推特點贊600+。

圖片描述

有網友表示:

太棒了!對剛入門的新手來說,資料集獲取、預處理和評估的自動化和標準化很有用。

透過分析不同模型及其超引數結果,來評估這些模型,本身是挺困難的一件事,你得在各種論文中查閱大量的非結構化資料。有了這個,這件事就輕鬆多了。(部分意譯)

圖片描述

許多網友對這個專案進行了友好的探討及建議,而開發人員也線上積極回應。

比如這位網友建議:能在每次提交的時候報告模型的超引數嗎?

圖片描述

作者很快回復說:英雄所見略同。下次更新就加上!

並且,他們還考慮在將來的更新中,讓使用者把連結新增到生成模型的訓練引數中。

圖片描述

傳送門

sotabench官網:

基準測試庫通用版:

基準測試庫PyTorch版:

—  —


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/2370/viewspace-2823864/,如需轉載,請註明出處,否則將追究法律責任。

相關文章