6 大經典機器學習資料集,3w+ 使用者票選得出,建議收藏

超神經HyperAI發表於2023-02-27
內容一覽:本期彙總了超神經下載排名眾多的 6 個資料集,涵蓋影像識別、機器翻譯、遙感影像等領域。這些資料集質量高、資料量大,經歷人氣認證值得收藏碼住。
關鍵詞:資料集 機器翻譯 機器視覺

資料集是機器學習模型訓練的基礎,優質的公開資料集對於模型訓練效果、研究成果可靠度等具有重要意義。

HyperAI超神經自上線以來,為資料科學從業者提供了大量優質的公開資料集。 本期內容分享,我們篩選出了 6 個熱門資料集,其總下載次數已達到 32,569 次。 希望這些資料集能進一步為廣大開發者服務~

注:本文梳理的資料集均來自為資料科學家服務的網站——超神經
https://hyper.ai/datasets

第 6 名:Tanks Temple 3D 重建資料集
在這裡插入圖片描述

在這裡插入圖片描述

Tanks Temple 影像資料集提供高解析度的影片,研究人員可以從影片中採集影像,依據影像進行三維重建。 該資料集包括訓練資料和測試資料兩類,其中測試資料分為中級組和高階組。

第 5 名:DOTA 航拍影像資料集
在這裡插入圖片描述

在這裡插入圖片描述

DOTA 全稱為 A Large-scale Dataset for Object DeTection in Aerial Images,是一個包含 2,806 張航拍圖的影像資料集,被用於在航拍影像中進行目標檢測,發現和評估影像中的物體。

這些影像來源包含不同感測器和平臺。每張影像的畫素尺寸在 800800 到 40004000 的範圍內,其中包含不同尺度、方向和形狀的物體。

往期推送請訪問:
DOTA 資料集:2806 張遙感影像,近 19 萬個標註例項

第 4 名:VGG-Face2 人臉識別資料集
在這裡插入圖片描述

在這裡插入圖片描述

VGG-Face2 是一個人臉影像資料集,包含共計 9131 個人的面部資料,影像均來自 Google 的圖片搜尋。資料集中的人在姿勢、年齡、種族和職業方面有很大差異。 該資料集由牛津大學的工程科學系視覺幾何組於 2015 年釋出,相關論文有《Deep Face Recognition》。

第 3 名:UCAS-AOD 遙感影像資料集

在這裡插入圖片描述

在這裡插入圖片描述

UCAS-AOD 是一個遙感影像資料集,用於飛機和車輛檢測。 該資料集由國科大於 2014 年首次釋出,並於 2015 年補充,相關論文有《Orientation Robust Object Detection in Aerial Images Using Deep Convolutional Neural Network》

第 2 名:OpenMantra 漫畫機器翻譯資料集

在這裡插入圖片描述

在這裡插入圖片描述

OpenMantra 是一個針對日文漫畫的機器翻譯評估資料集,包含五種不同風格(fantacy、romance、battle、mystery、slice of life)的漫畫。資料集中共包含 1593 個句子,848 個場景畫面和 214 頁漫畫, 由東京大學 Mantra 團隊釋出。

往期推送請檢視:
漫畫翻譯、嵌字 AI,東京大學論文被 AAAI’21 收錄

第 1 名:ImageNet 10 影像識別資料集
在這裡插入圖片描述

在這裡插入圖片描述

ImageNet 是目前世界上最大的影像識別資料庫,由史丹佛大學教授李飛飛等人建立。 主要用於機器視覺領域的影像分類和目標檢測。

資料集根據 WordNet 層次結構組織,其中每個節點(也稱為類別)由數百甚至數千張影像組成。該資料集共包含 2.2 萬個影像類別,約 1500 萬張圖片。

往期推送請訪問:
當年這個決定,讓李飛飛奠定 AI 江湖的女王地位

以上就是本期推薦的 6 個 hyper.ai 高頻下載資料集,更多資料科學優質公開資料集,可訪問以下連結下載:https://hyper.ai/datasets

—— 完 ——

相關文章