人工智慧資料標註案例之人臉識別 | 景聯文科技

景聯文科技發表於2023-01-06

人工智慧是未來的發展趨勢,人臉識別是人工智慧應用最為廣泛的一項技術,在現實生活中,我們使用的支付寶、微信的安全驗證、智慧手機的人臉解鎖功能等都運用到了人臉識別。作為人工智慧發展的三大要素之一,資料的作用不可小覷,其中資料採集與資料標註是資料發揮作用的重要方向,資料標註作為人工智慧的基石,決定了機器學習和深度學習的質量。人工智慧的快速發展催生了大量資料標註公司。

人工智慧資料標註案例之人臉識別 | 景聯文科技

什麼是人臉識別技術?

人臉識別技術是基於人的臉部特徵,首先對輸入的人臉影像或者影片流進行判斷,觀測其是否存在人臉,如果存在人臉,就需要進一步的給出每個臉的位置、大小和各個主要面部器官的位置資訊,並根據得到的資訊,進一步提取每個人臉中所包含的身份特徵,並將其與已知的人臉進行對比,從而識別出每個人臉的身份。

人臉識別的技術原理

人臉識別技術分為三個部分,即人臉檢測、人臉跟蹤和人臉對比。

人臉檢測就是面貌檢測,是指在動態的場景與複雜的背景中判斷是否存在人臉,並把它分離出來。

人臉跟蹤是指對被檢測到的人臉進行動態目標跟蹤。

人臉對比是對被檢測到的人臉進行身份確認或在人臉庫中進行目標搜尋。簡單來影片,就是將取樣到的面像與庫存的面像依次進行比對,並找出最佳的匹配物件。

人臉識別的四個特點

一是便捷性。因為人臉是一種生物特徵,不需要攜帶類似身份證的東西。

二是非強制性。識別的過程甚至不需要物件的配合,只要拍攝到人臉就可以進行識別,例如安防領域就是如此。

三是非接觸性。人臉識別是人們不需要跟裝置進行接觸,相比指紋更加安全一些。特別是在疫情爆發後,人臉識別顯得格外重要。

四是並行處理。這是指將一張照片裡有多個人臉同時進行處理,這不像指紋和虹膜,需要一個一個來,有效的提高了效率。

基於以上特點,人臉識別正在被廣泛的應用在各個領域。大家在生活中隨處都可以看到人臉識別的應用。

人臉識別技術的識別演算法

一般來說,人臉識別系統包括影像攝取、人臉定位、影像預處理、以及人臉識別(身份確認或者身份查詢)。系統輸入一般是一張或者一系列含有未確定身份的人臉影像,以及人臉資料庫中的若干已知身份的人臉圖象或者相應的編碼,而其輸出則是一系列相似度得分,表明待識別的人臉的身份。

人臉識別技術的優勢和劣勢

人臉識別技術具有便捷性、準確性以及難以偽造性等,與其他生物特徵識別技術相比,人臉識別技術具有準確率高、誤識別率等特點。但是人臉影像在現實世界中的呈現具有高度的可變性,因此人臉識別技術還需要進行更大的改進。人臉影像可變的地方包括:頭部姿勢、遮擋、光照條件、年齡、人臉表情等,這些因素都會影響人臉識別的準確性。

人臉識別技術的應用場景

在人們日常生活中,人臉識別的應用已經變得越來越廣泛,只要需要對人們的身份進行識別的地方,如:門禁系統、安防系統、身份證、無人超市、電子護照、自主服務系統(如ATM)、資訊保安系統等。

近年來,隨著影片監控的快速普及,眾多的影片監控應用迫切需要一種遠距離且使用者非配合狀態下的快速身份識別技術,人臉識別技術無疑是最好的選擇,採用快速人臉檢測技術可以從監控影片圖象中實時查詢人臉,並與人臉資料庫進行實時比對,從而實現快速的身份識別。

未來,只要需要對人們身份進行識別的地方,就都有可能運用到人臉識別技術。

人工智慧資料標註案例之人臉識別 | 景聯文科技

人臉識別主要的資料標註方式:關鍵點標註

關鍵點標註:人臉關鍵點是對於影像中人臉五官與輪廓定位的標註,主要用來對人臉的關鍵位置,如臉廓、眉毛、眼睛、嘴唇進行定位,人臉關鍵點檢測是人臉識別過程中重要的一步。人臉關鍵點從25點到109點,數量越來越多,越來越精細,對標註員的基本功和標註團隊稽核能力的要求也越來越高,標註質量的好壞,對人工智慧人臉模型的演算法精確度有很大作用。

人工智慧資料標註案例之人臉識別 | 景聯文科技

景聯文科技為人臉識別技術提供資料採集標註方案

人臉識別需要積累採集標註大量的人臉影像相關資料,用來驗證演算法,不斷地提高識別準確性。景聯文科技《230人中國人46000張真假人臉影像資料集》、《2834個id25506張跨年齡影像資料集》、《20000張人臉關鍵點標註影像訓練集》等可以運用於人臉識別演算法的資料集。

作為AI訓練資料領域的專業資料採集標註公司,景聯文科技一直致力於為人工智慧技術的實現提供高質量的資料標註支援,自建資料標註平臺,定製成熟的標註、稽核、質檢機制,支援語音工程(語音切割、ASR語音轉寫、語音情緒判定、聲紋識別標註等)、計算機視覺(拉框標註、語義分割、3D點雲標註、關鍵點標註、線標註、2D/3D融合標註、目標跟蹤、圖片分類等)、自然語言處理(OCR轉寫、文字資訊抽取、NLU語句泛化)多型別資料標註。

景聯文科技現有資料庫擁有聲音、文字成品資料集200T,包括TTS、ASR、NLU、NLP等發音字典,影像成品資料集420T,主要涵蓋人體生物識別資料(指紋、人臉、步態、虹膜等)等等,其他資料集90T,包括車輛、道路場景、違禁品x光機等成品資料集。

未來,景聯文科技將持續發揮高質量和場景化的獨特優勢,深耕資料採集標註產業,持續提升資料採集及標註能力,打造更為高品質、高標準的AI資料服務,釋放資料要素價值。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70025739/viewspace-2931106/,如需轉載,請註明出處,否則將追究法律責任。

相關文章