研究表明：用於機器學習的資料集正在被影響壟斷 - Unite.AI

banq發表於2021-12-06

構建一個好的資料集需要付出大量的努力，如果它變得更大，則比例更大，人們喜歡大資料集，因為您可以從中訓練出更強大的模型。因此，人們傾向於被資金充足的機構製作的資料集所吸引。
加州大學和谷歌研究中心的一篇新論文發現，少數“基準”機器學習資料集，主要來自有影響力的西方機構，經常來自政府組織，正日益主導人工智慧研究領域。這種“預設”使用高度流行的開源資料集（例如ImageNet）的趨勢帶來了許多令人擔憂的實際、道德甚至政治原因。
全球資料集使用的不平等越來越嚴重，在調查的 43,140 個樣本中，超過 50% 的資料集使用由十二個精英機構（主要是西方機構）引入的資料集。占主導地位的機構包括史丹佛大學、微軟、普林斯頓、Facebook、谷歌、馬克斯普朗克研究所和 AT&T。排名前十的資料集來源中有四個是企業機構。

相關文章

機器學習之資料集的劃分
2020-06-14
機器學習
準備資料集用於flink學習
2020-11-14
機器學習筆記——資料集分割
2018-09-25
機器學習筆記
33個機器學習常用資料集
2019-04-19
機器學習
分散式機器學習常用資料集
2021-11-28
分散式機器學習
哪些特徵對我的機器學習模型影響最大？
2018-12-14
特徵機器學習模型
AI和機器學習對量化交易領域的影響
2019-01-24
AI機器學習
伯克利最新研究：用演算法解決演算法偏差？公平機器學習的延遲影響
2018-05-23
演算法機器學習
機器學習中的有標註資料集和無標註資料集
2023-05-08
機器學習
最強資料集集合：50個最佳機器學習公共資料集
2018-11-08
機器學習
Java可以用於機器學習和資料科學嗎？ - kdnuggets
2020-11-02
Java機器學習資料科學
16個用於資料科學和機器學習的頂級平臺
2019-07-07
資料科學機器學習
祕籍 | 機器學習資料集網址大全
2019-01-27
機器學習
訓練機器學習的資料集大小很重要 - svpino
2021-04-23
機器學習
AutoTiKV：基於機器學習的資料庫調優
2019-10-10
機器學習資料庫
機器學習高質量資料集大合輯
2018-10-24
機器學習
機器學習的訓練集
2021-02-05
機器學習
機器學習實戰原始碼和資料集下載
2018-07-18
機器學習原始碼
機器學習-資料清洗
2019-03-02
機器學習
機器學習大資料
2019-05-10
機器學習大資料
2018年最具影響力的20篇資料科學研究論文，盤它！
2019-01-30
資料科學
人工智慧與深度學習的未來：社會影響、應用與研究進展
2019-06-22
人工智慧深度學習
機器學習中的五個實際問題及其對業務的影響
2020-07-29
機器學習
在大型金融資料集上使用機器學習的特徵工程測試
2018-09-23
機器學習特徵工程
一個真實資料集的完整機器學習解決方案（上）
2020-12-15
機器學習
一個真實資料集的完整機器學習解決方案（下）
2020-12-18
機器學習
吳恩達機器學習作業程式碼和資料集
2020-11-27
吳恩達機器學習
機器學習之模型診斷
2020-02-14
機器學習模型
機器學習-- 資料轉換
2018-11-17
機器學習
機器學習之清理資料
2020-06-16
機器學習
機器學習演算法（五）：基於企鵝資料集的決策樹分類預測
2023-03-25
機器學習演算法
普利茅斯大學：研究顯示孩子行為非常容易受到機器人的影響
2018-08-18
機器人
舉兩個栗子：如何正確建立個人的機器學習專案集
2018-12-13
機器學習
學歷影響大資料工程師的收入嗎
2018-04-26
大資料工程師
谷歌機器學習實戰的7個步驟:用於結構化資料的TensorFlow示例
2020-05-18
谷歌機器學習
從 0 開始機器學習 - 機器學習演算法診斷
2020-07-16
機器學習演算法
用於Web開發的5種機器學習框架
2018-10-25
Web機器學習框架
做資料分析需要學習機器學習嗎？
2020-01-15
機器學習