機器學習免費跑分神器:整合各大資料集,連線GitHub就能用,還能驗證
栗子 魚羊 發自 凹非寺
量子位 報導 |
搞機器學習的小夥伴們,免不了要在各種資料集上,給AI模型跑分。
現在,Papers with Code (那個以論文搜程式碼的神器) 團隊,推出了自動跑分服務,名叫sotabench,以跑遍所有開源模型為己任。
有了它,不用上傳程式碼,只要連線GitHub專案,就有云端GPU幫你跑分;每次提交了新的commit,系統又會自動更新跑分。還有世界排行榜,可以觀察各路強手的成績。
除了支援各大主流資料集,還支援使用者上傳自己的資料集。
也可以看看,別人的論文結果,到底靠譜不靠譜。
比如說,fork一下Facebook的FixRes這個專案,配置一下評估檔案:
然後一鍵關聯,讓Sotabench的GPU跑一下ImageNet的影像分類測試。
就能得到這樣的結果:
Top-1準確率,Top-5準確率,跟論文的結果有何差距(見注),執行速度,全球排名,全部一目瞭然。
注:ε-REPR,結果與論文結果差距在0.3%以內時打勾,差距≥0.3%且比論文結果差顯示為紅叉,比論文結果好顯示為勾+
這個免費的跑分神器,釋出一天,便受到熱烈歡迎:推特點贊600+,Reddit熱度270+。
網友紛紛表示:這對開發者社群來說太有用了!
那麼,先來看一下sotabench的功能和用法吧。
用法簡單,海納百川
團隊說,sotabench就是Papers with Code的雙胞胎姐妹:
Papers with Code大家很熟悉了,它觀察的是論文報告的跑分。可以用來尋找高分模型對應的程式碼,是個造福人類的工具。
與之互補,sotabench觀察的是開源專案,程式碼實際執行的結果。可以測試自己的模型,也能驗證別家的模型,是不是真有論文說的那麼強。
它支援跟其他模型的對比,支援檢視速度和準確率的取捨情況。
那麼,sotabench怎麼用?簡單,只要兩步。
第一步,先在本地評估一下模型:
在GitHub專案的根目錄裡,建立一個sotabench.py檔案。裡面可以包含:載入、處理資料集和從中得出預測所需的邏輯。每提交一個commit,這個檔案都會執行。
然後,用個開源的基準測試庫來跑你的模型。
這個庫可以是sotabench-eval,這個庫不問框架,裡面有ImageNet等等資料集;也可以是torchbench,這是個PyTorch庫,和PyTorch資料集載入器搭配食用更簡單。
一旦成功跑起來,就可以進入下一步。
第二步,連線GitHub專案,sotabench會幫你跑:
點選這個按鈕,連到你的GitHub賬號,各種專案就顯現了。選擇你要測試的那個專案來連線。
連好之後,系統會自動測試你的master,然後記錄官方結果,一切都是跑在雲端GPU上。
測試環境是根據requirement.txt檔案設定的,所以要把這個檔案加進repo,讓系統捕捉到你用的依賴項。
從此,每當你提交一次commit,系統都會幫你重新跑分,來確保分數是最新的,也確保更新的模型依然再工作。
這樣一來,模型出了bug,也能及時知曉。
如果要跑別人家的模型,fork到自己那裡就好啦。
目前,sotabench已經支援了一些主流資料集:
列表還在持續更新中,團隊也在盛情邀請各路豪傑,一同充實benchmark大家庭。
既支援建立一個新的benchmark,也支援為現有benchmark新增新的實現。
你可以給sotabench-eval或torchbench專案提交PR,也可以直接建立新的Python包。
一旦準備就緒,就在sotabench官網的論壇上,釋出新話題,團隊會把你的benchmark加進去的:
好評如潮
這樣的一項服務推出,網友們紛紛點贊,好評如潮,推特點贊600+。
有網友表示:
太棒了!對剛入門的新手來說,資料集獲取、預處理和評估的自動化和標準化很有用。
透過分析不同模型及其超引數結果,來評估這些模型,本身是挺困難的一件事,你得在各種論文中查閱大量的非結構化資料。有了這個,這件事就輕鬆多了。(部分意譯)
許多網友對這個專案進行了友好的探討及建議,而開發人員也線上積極回應。
比如這位網友建議:能在每次提交的時候報告模型的超引數嗎?
作者很快回復說:英雄所見略同。下次更新就加上!
並且,他們還考慮在將來的更新中,讓使用者把連結新增到生成模型的訓練引數中。
傳送門
sotabench官網:
基準測試庫通用版:
基準測試庫PyTorch版:
— 完 —
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/2370/viewspace-2823864/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 什麼是免費SSL證書?免費SSL證書能用嗎?
- 深度學習,機器學習神器,白嫖免費GPU深度學習機器學習GPU
- 免費SSL證書到底能不能用呢
- 叢集資料庫主機名不能用大寫和連線符資料庫
- 機器學習之資料集的劃分機器學習
- SSL證書需要花錢買嗎?免費SSL證書不能用?
- spring boot整合cassandra 連線帶安全驗證的方式Spring Boot
- 免費的代理IP能用嗎?
- 3個免費資料採集工具網站網站
- 資料免費
- 爽了!免費的SSL,還能自動續期!
- 1.6.5.2. 通過密碼檔案驗證連線資料庫密碼資料庫
- JDBC連線資料庫經驗JDBC資料庫
- 4款免費可用的資料整合平臺亮點
- 這樣也能連線資料庫[zt]資料庫
- 免費的大資料學習資料及學習路線、這一份就足夠了大資料
- 一個免費借閱,還能送上門的網站網站
- 免費ftp站點,使用三款ftp工具連線免費ftp站點FTP
- 免費!資料科學及機器學習必備書單下載!資料科學機器學習
- OceanBase 資料庫認證專員 OBCA 上線啦!報名認證考試限時免費資料庫
- Oracle RMAN 連線資料庫認證方法Oracle資料庫
- 高鐵上終於可以連免費WiFi了:不僅免費 還有千部影視劇WiFi
- SSL 免費證書
- 免費 ssl 證書
- 假證還能全網查驗?百家政府網站資料遭黑客篡改網站黑客
- 用免費TPU訓練Keras模型,速度還能提高20倍!Keras模型
- iOS教程 免費使用SMSSDK語音驗證的方法iOS
- 利用Github搭建免費圖床Github圖床
- 您的免費OA系統能用幾年?
- 程式碼快不快?跑個分就知道
- 免安裝Oracle連線資料庫(odbc驅動)Oracle資料庫
- 免安裝oracle軟體連線oracle資料庫Oracle資料庫
- 藉助Windows自帶的ODBC工具驗證資料庫連線是否通暢Windows資料庫
- Listen1 Mac付費音樂免費聽神器Mac
- Spring Boot整合Druid資料庫連線池Spring BootUI資料庫
- 大資料就業前景分析太到位了,這套教程免費領大資料就業
- 免費OA萬能魔錶管理,快速查詢和提取資料庫的資料資料庫
- sourcetree 免登陸版,一款Github管理神器Github