研究表明:用於機器學習的資料集正在被影響壟斷 - Unite.AI
構建一個好的資料集需要付出大量的努力,如果它變得更大,則比例更大,人們喜歡大資料集,因為您可以從中訓練出更強大的模型。因此,人們傾向於被資金充足的機構製作的資料集所吸引。
加州大學和谷歌研究中心的一篇新論文發現,少數“基準”機器學習資料集,主要來自有影響力的西方機構,經常來自政府組織,正日益主導人工智慧研究領域。這種“預設”使用高度流行的開源資料集(例如ImageNet)的趨勢帶來了許多令人擔憂的實際、道德甚至政治原因。
全球資料集使用的不平等越來越嚴重,在調查的 43,140 個樣本中,超過 50% 的資料集使用由十二個精英機構(主要是西方機構)引入的資料集。占主導地位的機構包括史丹佛大學、微軟、普林斯頓、Facebook、谷歌、馬克斯普朗克研究所和 AT&T。排名前十的資料集來源中有四個是企業機構。
相關文章
- 機器學習之資料集的劃分機器學習
- 準備資料集用於flink學習
- 分散式機器學習常用資料集分散式機器學習
- 33個機器學習常用資料集機器學習
- 機器學習筆記——資料集分割機器學習筆記
- 哪些特徵對我的機器學習模型影響最大?特徵機器學習模型
- AI和機器學習對量化交易領域的影響AI機器學習
- 機器學習中的有標註資料集和無標註資料集機器學習
- 伯克利最新研究:用演算法解決演算法偏差?公平機器學習的延遲影響演算法機器學習
- 最強資料集集合:50個最佳機器學習公共資料集機器學習
- Java可以用於機器學習和資料科學嗎? - kdnuggetsJava機器學習資料科學
- 16個用於資料科學和機器學習的頂級平臺資料科學機器學習
- 祕籍 | 機器學習資料集網址大全機器學習
- 訓練機器學習的資料集大小很重要 - svpino機器學習
- AutoTiKV:基於機器學習的資料庫調優機器學習資料庫
- 機器學習高質量資料集大合輯機器學習
- 機器學習的訓練集機器學習
- 機器學習實戰原始碼和資料集下載機器學習原始碼
- 機器學習 大資料機器學習大資料
- 機器學習-資料清洗機器學習
- 2018年最具影響力的20篇資料科學研究論文,盤它!資料科學
- 人工智慧與深度學習的未來:社會影響、應用與研究進展人工智慧深度學習
- 機器學習中的五個實際問題及其對業務的影響機器學習
- 一個真實資料集的完整機器學習解決方案(上)機器學習
- 一個真實資料集的完整機器學習解決方案(下)機器學習
- 在大型金融資料集上使用機器學習的特徵工程測試機器學習特徵工程
- 吳恩達機器學習作業程式碼和資料集吳恩達機器學習
- 機器學習之模型診斷機器學習模型
- 機器學習之清理資料機器學習
- 機器學習-- 資料轉換機器學習
- 機器學習演算法(五):基於企鵝資料集的決策樹分類預測機器學習演算法
- 普利茅斯大學:研究顯示孩子行為非常容易受到機器人的影響機器人
- 舉兩個栗子:如何正確建立個人的機器學習專案集機器學習
- 谷歌機器學習實戰的7個步驟:用於結構化資料的TensorFlow示例谷歌機器學習
- 學歷影響大資料工程師的收入嗎大資料工程師
- 做資料分析需要學習機器學習嗎?機器學習
- 用於Web開發的5種機器學習框架Web機器學習框架
- 從 0 開始機器學習 - 機器學習演算法診斷機器學習演算法