✏️ 編者按:
短視訊的興起見證了一場資訊革命。圖文時代逐漸過渡到多媒體時代,對視訊的理解和搜尋已成為當下的關鍵技術。作為國民級短視訊 App 的 AI 中臺,快手 MMU(Multimedia understanding 多媒體內容理解)團隊是如何在多種應用場景下應對自如的?Milvus 社群有幸邀請到了來自快手 MMU 的研發工程師餘晉,與大家分享 Milvus 在快手中的應用。
? 嘉賓簡介:餘晉,快手多媒體內容理解工程師,負責引擎架構、大規模向量計算,畢業於北京大學,喜歡讀書與慢跑。
完整視訊請戳:https://www.bilibili.com/vide...
MMUMMR1.0:基於 Milvus 資料庫的向量近似計算平臺
快手 MMU 是負責快手短視訊搜尋系統以及視訊理解的 AI 中臺,業務覆蓋 OCR,ASR,分詞,NER 等基礎 AI 演算法;短視訊分類,標籤體系建設等中臺技術;以及短視訊搜尋等系統服務。在該 AI 中臺中,向量計算起到了至關重要的作用。
快手 MMU 團隊需要處理許多與向量計算相關的應用場景:相似視訊檢索、視訊合規檢索、原創視訊檢測、商品檢測……在接觸 Milvus 之前,團隊使用的是自研向量檢索系統,但實現方式比較複雜,維護成本高,系統可用性一般,亟需一款高效能、易接入且高穩定性的向量資料庫供各個業務方使用。
經過一系列的產品調研,快手 MMU 團隊最終選擇了社群活躍、穩定與效能兼備的 Milvus 作為 AI 中臺,搭建包括 AI 模型、資料分析工具、ANNS 等平臺。目前已經實現的場景包含千億級的視訊檢索、十億級的商品檢索,後續也會有更多場景逐步遷徙至 Milvus 搭建的 ANNS 平臺。
基於 Milvus 1.1 的 MMUMMR 1.0 架構如上圖所示,其中,向量資料儲存計算是基於 Milvus 的資料分片和歸併管理。Milvus 資料庫支援雲原生分散式架構,具有儲存計算分離,寫入、構建、分佈計算、查詢分離的特點,流批一體、彈性伸縮。
(Milvus 2.0 也在前不久和大家見面了,一起來看看 Milvus 2.0 有哪些新功能吧!)
冠軍方案分析:當我們討論向量計算的時候,我們在討論什麼
快手團隊在前不久舉辦的國際首屆向量檢索大賽中獲得了賽道第一的好成績。該賽道要求參賽隊伍針對 6 個十億規模的資料集中的至少三個,達到在 10000 QPS 以上效能的同時,相對基準方案 Faiss 的 IVFPQ 方法儘可能提高召回率。快手團隊的方案針對 IVFPQ 方法進行了全方面的優化,在四個資料集上都比 baseline 高 5% - 10%。
關於國際首屆向量檢索比賽的更多資訊,歡迎參考:產學研用跨界對話,向量資料庫研討會回顧
向量近似計算 API 介紹和應用
Milvus 資料庫提供一整套簡單直觀的 API。MMUMMR 1.0 的 Collection 索引庫就使用了 create、drop、count、stat 等 Milvus 原生 API,實現最近三天的冷啟視訊特徵召回、最近 90 天的近期熱門視訊特徵召回等自動生命週期管理類業務應用。
Milvus Collection API 地址是:https://milvus.io/api-referen...
此外,MMUMMR 1.0 還在視訊查重、視訊生成物料檢索、商品 SKU 識別、平行語料建設等業務中採用高精度 KNN 檢索;在視訊商品檢索和視訊檢索等場景中採用屬性檢索;在視訊封面去重業務中採用 ADBKmeans 聚類的方法,具體實踐詳見視訊 ?