研究表明:用於機器學習的資料集正在被影響壟斷 - Unite.AI
構建一個好的資料集需要付出大量的努力,如果它變得更大,則比例更大,人們喜歡大資料集,因為您可以從中訓練出更強大的模型。因此,人們傾向於被資金充足的機構製作的資料集所吸引。
加州大學和谷歌研究中心的一篇新論文發現,少數“基準”機器學習資料集,主要來自有影響力的西方機構,經常來自政府組織,正日益主導人工智慧研究領域。這種“預設”使用高度流行的開源資料集(例如ImageNet)的趨勢帶來了許多令人擔憂的實際、道德甚至政治原因。
全球資料集使用的不平等越來越嚴重,在調查的 43,140 個樣本中,超過 50% 的資料集使用由十二個精英機構(主要是西方機構)引入的資料集。占主導地位的機構包括史丹佛大學、微軟、普林斯頓、Facebook、谷歌、馬克斯普朗克研究所和 AT&T。排名前十的資料集來源中有四個是企業機構。
相關文章
- 澳大利亞昆士蘭大學:研究表明玩遊戲比看電視對孩子的影響好遊戲
- 擁抱Linux 走出壟斷陰影 (轉)Linux
- 業務資料抓取的影響
- 基於row cache object latch研究對於sga抖動的影響Object
- 資料對於製造業的國際化影響
- 基於卷積神經網路的軸承故障診斷研究--資料集介紹卷積神經網路
- 伯克利最新研究:用演算法解決演算法偏差?公平機器學習的延遲影響演算法機器學習
- 關於資料庫開啟大頁對效能的影響資料庫
- 批操作效能影響診斷
- 機器學習之資料集的劃分機器學習
- 大資料教程之大資料的影響二大資料
- 哪些特徵對我的機器學習模型影響最大?特徵機器學習模型
- “影響者研究”系列(一):社會網路化時代影響者對營銷創新的影響
- 大資料應用於行業研究大資料行業
- 33個機器學習常用資料集機器學習
- 機器學習筆記——資料集分割機器學習筆記
- 分散式機器學習常用資料集分散式機器學習
- 機器學習中的有標註資料集和無標註資料集機器學習
- AI和機器學習對量化交易領域的影響AI機器學習
- 表資料的儲存對索引的影響索引
- 最強資料集集合:50個最佳機器學習公共資料集機器學習
- 做restore時用datafilecopy恢復時,影響資料檔案的大小REST
- “影響者研究”系列(四):從關係和表達的角度發現影響者
- 國家資料局成立對企業的影響:啟用資料要素 重構資料價值
- 如何通過資料管理影響資料質量
- 驗證資料壓縮對DML的影響
- 影響資料檢索效率的幾個因素
- 磁碟排序對Oracle資料庫效能的影響排序Oracle資料庫
- 大資料的潛在影響及制度需求大資料
- “影響者研究”系列(三):如何藉助網路影響者做營銷?
- 谷歌遭反壟斷投訴:Chrome 瀏覽器取消 cookie 影響行業營收,現已推遲該計劃谷歌Chrome瀏覽器Cookie行業營收
- ILSR報告:亞馬遜的壟斷之路亞馬遜
- 臨時資料檔案 offline 對於匯入匯出的影響
- 遊戲暗示對於遊戲玩家的影響遊戲
- 關於OPcache對Swoole影響的理解opcache
- JAVA 異常對於效能的影響Java
- 關於drop操作對role的影響
- 2018年最具影響力的20篇資料科學研究論文,盤它!資料科學