2018年10月17日,騰訊AI Lab宣佈正式開源“Tencent ML-Images”專案,地址為github.com/Tencent/ten…。該專案由多標籤影象資料集ML-Images,以及業內目前同類深度學習模型中精度最高的深度殘差網路ResNet-101構成。
該開源專案的主要內容包括:
1. ML-Images資料集的全部影象URLs,以及相應的類別標註。出於原始影象版權的考慮,此次開源將不直接提供原始影象,使用者可利用我們提供的下載程式碼和URLs自行下載影象。
2. ML-Images資料集的詳細介紹,包括影象來源,影象數量,類別數量,類別的語義標籤體系,標註方法,以及影象的標註數量等統計量。
3. 完整的程式碼和模型。我們提供的程式碼涵蓋從影象下載,影象預處理,基於ML-Images的預訓練,基於ImageNet的遷移學習,到基於訓練所得模型的影象特徵提取的完整流程。該專案提供了基於小資料集的訓練示例,以方便使用者快速體驗我們的訓練流程。該專案還提供了非常高精度的ResNet-101模型(在單標籤基準資料集ImageNet的驗證集上的top-1精度為80.73%)。使用者可根據自身需求,隨意選用該專案的程式碼或模型。
“Tencent ML-Images”作為騰訊開源第58個專案(https://github.com/Tencent),是騰訊AI Lab在計算機視覺領域所累積的基礎能力的一次釋放,將為人工智慧領域的科研人員和工程師提供充足的高質量訓練資料,及簡單易用、效能強大的深度學習模型。在工作中,ML-Images能為包括影象、視訊等在內的視覺任務提供強大支撐,並助力影象分類、物體檢測、物體跟蹤、語義分割等技術水平的提升,促進人工智慧行業共同發展。