近日,創新奇智(AInnovation)在國際權威影像分割競賽Cityscapes上獲得例項分割評測的第一名,以明顯優勢重新整理例項分割任務世界紀錄,超越NVIDIA(英偉達)、Facebook、Uber、香港中文大學、商湯、搜狗、科大訊飛等幾十支強勁的國際企業和科研機構。
迄今為止,在短短5個月時間內,創新奇智已連續在世界頂級人臉檢測競賽WIDER FACE、物體檢測競賽 PASCAL VOC、影像分割競賽Cityscapes中取得三連冠的佳績,充分彰顯了創新奇智在計算機視覺識別領域的技術實力和演算法創新能力。
圖片來源:Cityscapes官網
Cityscapes 資料集
Cityscapes評測資料集在2015年由賓士公司推動釋出,是目前公認的機器視覺領域內最具權威性和專業性的影像分割資料集之一。在Cityscapes評測資料集之中,共分為畫素級分割和例項分割兩個子任務,其中相較於畫素級分割,例項分割的難度要更大,也是計算機視覺領域最重要、最具挑戰的任務之一。
在Cityscapes例項分割任務所對應的資料集中,包含了5000張精細標註的影像和20000張粗略標註的影像,其中包含50個城市的不同場景、不同背景、不同街景,以及30類涵蓋地面、建築、交通標誌、自然、天空、人和車輛等的物體標註。該資料集以關注真實場景下的環境理解著稱,任務難度更高。
截至目前,Cityscapes評測吸引了近百支隊伍參賽,包括Facebook、Uber、香港中文大學、商湯、NVIDIA(英偉達)、搜狗、科大訊飛等眾多國內外優秀創新企業和頂尖學術機構參加。創新奇智提出的AInnoSegmentation演算法在各項指標中均有突破性進展,各項指標均名列第一,綜合成績第一。
創新奇智AInnoSegementation演算法
AInnoSegmentation演算法是以著名的Mask R-CNN網路架構為基礎,骨幹網路使用SE-Resnet152網路架構,使用它來提取多尺度特徵圖,頸部網路採用一個6級特徵金字塔網路(FPN),用來生成更加豐富的多尺度卷積特徵。然後使用自研的特徵融合模組作為特徵融合器,後面連線兩個共享子網,一個負責分類和框迴歸,一個負責影像分割。
Mask R-CNN網路圖
看看AInnoSegementation演算法的表現吧:
AInnoSegementation演算法在Cityscapes資料集上的表現
例項分割演算法的商業價值
創新奇智自成立伊始就瞄準高精尖的人工智慧演算法在製造、零售、金融等多個領域的商業化產品落地,重點突破人工智慧演算法的領先性和成熟性,形成具有巨大商業潛力的AI產品和解決方案。目前,創新奇智已經打造出業界領先的自動化機器學習平臺和AI工業視覺平臺ManuVision,並發表了數篇頂級會議論文。這些成果實實在在提高了演算法在實際場景的精度,提升了訓練和推理的速度,並極為高效地整合了計算資源。
AInnoSegmentation演算法在工業視覺中應用非常廣泛,典型場景包括:缺陷檢測,定位,識別等複雜場景。例如,創新奇智已將該演算法應用於成衣、磁性材料等質檢場景下,提高產品的質檢精準度。
AInnoSegmentation演算法還可以應用於零售業中的渠道陳列和智慧貨櫃等商品識別場景,提高商品識別準確度的同時,幫助客戶提升運營效率。
另外,創新奇智還將AInnoSegmentation演算法應用於鋼鐵廠智慧鐵水無人機車運輸系統上,進一步提高該解決方案的成熟度和技術壁壘。