深度學習在商戶掛牌語義理解的實踐
導讀:高德地圖擁有幾千萬的POI興趣點,例如大廈、底商、學校等資料,而且每天不斷有新的POI出現。為了維持POI資料的鮮度,高德會透過大量的資料採集來覆蓋和更新。現實中POI名稱複雜,多變,同時,名稱制作工藝要求嚴格,透過人工來製作POI名稱,需要花費大量的人力成本。
因此,POI名稱的自動生成就顯得格外重要,而機器對商戶掛牌的語義理解又是其中關鍵的一環。本文主要介紹相關技術方案在高德的實踐和業務效果。
一、背景
現實世界中,商戶的掛牌各式各樣,千奇百怪,如何讓機器正確的理解牌匾語義是一個難點。商戶掛牌的文字種類有很多,如下圖所示,我們可以看到一個商戶牌匾的構成。
結合POI的名稱制作工藝,我們目前將POI的牌匾的文字行分為4大類:主名稱、經營性質(包括經營範圍,具體的進行專案)、分店名、噪聲(包括非POI文字,地址,聯絡方式),前面3個類別會參與到POI名稱制作中。如上圖所示的牌匾,它輸出的規範名稱應該是“世紀宏圖不動產 (興業路店)”。其中“世紀宏圖”是主名稱,“不動產”是經營範圍,而“興業路店”是分店名。
從牌匾中找出製作名稱所需要的文字,不僅僅需要文字行自身的一些特徵,還需要透過結合牌匾上下文,以及影像的資訊進行分析。單純的文字行識別會遇到下面的問題,如下圖,在兩個牌匾中都提到了“中國電信”,但是它們的意義是不一樣的,這時必須結合上下文的理解。
二、技術方案
單純從文字的語義理解的角度出發,那麼這個應該是一個文字分類問題。但是直接的分類效果不佳。現實中在理解牌匾文字行語義的時候,需要結合圖形,位置,內容,以及上下文關係綜合來判斷。為此,我們將商戶掛牌理解的這個問題分解成兩個子問題來解決,1.如何結合影像、文字、以及空間位置;2.如何結合上下文關係。因此,我們提出了Two-Stages級聯模型。
2.1 Two-Stages 級聯模型
Two-stages級聯模型分為兩個主要的階段:第一階段提取單文字資訊特徵,包括文字位置和文字內容等,第二階段提取牌匾中文字行上下文關係特徵,消除只用單個文字識別容易造成的歧義,準確識別出該文字屬性。
2.1.1 Stage One 單文字行特徵提取
單文字行特徵可以分為詞性結構(token level)特徵和句子語義(sentence level)特徵。除此之外,位置資訊(PV)也是比較重要的資訊,需要進行特徵提取和編碼。將以上特徵進行融合,得到了單文字行特徵。
token level層的特徵提取方面,結合名稱的構成以及名稱工藝,我們定義了三種詞性: 核心詞(C)、通用詞(U)、結尾詞(T)。在這裡我們使用LSTM網路來學習名稱的詞性序列。
sentence leve層的特徵提取方面,由於我們的標註量相對比較少,採用了具有大量先驗知識的BERT模型。同時,為了更好的符合當前業務場景的需求,我們結合業務中POI的資料集合,在原來Google官方提供的預訓練模型基礎上繼續pre-training,得到新的模型BERT-POI。
預訓練的POI文字語料沒有太多的上下文環境,在構造樣本時,我們將兩個POI名稱串起來或是同一個POI隨機切分,中間都用SEP隔開,進行多工學習:缺字補全和預測兩個文字行是否屬於同一POI。經過實驗發現,在POI資料上預訓練模型BERT-POI 比Google釋出模型BERT-Google,缺字補全和同一POI判定兩項任務上名,正確率高20%左右。
此外,將預訓練的模型用於下游屬性識別任務上,BERT-POI與BERT-Google相比,提升主名稱,分店名,營業範圍的召回3%~6%。
下圖展示了我們預訓練的過程圖:
隨後,我們對預訓練好的BERT-POI在進行了finetune,提取出sentence leve層的特徵。
2.1.2 Stage-Two 文字相互關係提取
Stage One提取到了單文字行的特徵,那如何去實現上下文的關聯,我們加入了Stage Two的模組,模型結構如下:
Stage Two最主要是用BILSTM(Bidirectional LSTM)處理stage one輸出特徵,能夠將當前文字特徵和牌匾內其他文字特徵進行學習,消除歧義。
三、業務效果
牌匾透過語義理解後,會根據具體的輸出型別來制定名稱生成的策略。例如:對於單主+噪聲牌匾,我們直接將主名稱作為POI名稱,而對於單主+分店名+經營性質+噪聲的牌匾,我們會分析主名稱的結構,看是否需要拼接經營性質。
下圖展示了當前我們牌匾語義理解和名稱的部分拼接策略:
圖3.1單主+噪聲場景
圖3.2 單主+分店名場景
圖3.3單主+經營性質場景(主名稱中有經營性質)
圖3.4 單主+經營性質場景(主名稱中無經營性質)
四、小結
目前商戶牌匾語義理解模組的準確率在95%以上,在POI的名稱自動生成中起到的重要的作用。商戶牌匾的語義理解模組只是POI名稱自動化的一部分內容,在POI名稱自動化中還會涉及到噪聲牌匾過濾、牌匾是否依附建築物、敏感類別、文字的缺失、名稱生成、名稱糾錯等模組。我們會在圖文多模態這塊更深入的探索,更多地應用於我們現實場景中,生產更多、更高質量的資料。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69941357/viewspace-2667260/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 學術派 | 愛奇藝深度語義表示學習的探索與實踐
- 深度學習在小米電商業務的應用實踐深度學習
- 在 Google Colab 中快速實踐深度學習Go深度學習
- 深度學習在搜尋業務中的探索與實踐深度學習
- 達觀資料王文廣:如何玩轉自然語言理解和深度學習實踐?深度學習
- 深度學習在美團搜尋廣告排序的應用實踐深度學習排序
- 深度學習的應用與實踐深度學習
- 深度學習在美團配送ETA預估中的探索與實踐深度學習
- 深度學習在騰訊的平臺化和應用實踐(全)深度學習
- 美團深度學習系統的工程實踐深度學習
- 八大深度學習最佳實踐深度學習
- 雲上深度學習實踐分享——雲上MXNet實踐深度學習
- 深入理解深度學習深度學習
- 深度學習淺層理解深度學習
- [深度學習]生成對抗網路的實踐例子深度學習
- 如何理解雅克比矩陣在深度學習中的應用?矩陣深度學習
- 基於深度學習的影像分割在高德的實踐深度學習
- 一文了解深度學習在NLP中的最佳實踐經驗和技巧深度學習
- 讓 PM 全面理解深度學習深度學習
- 利用docker部署深度學習模型的一個最佳實踐Docker深度學習模型
- 愛奇藝深度學習雲平臺的實踐及優化深度學習優化
- 基於CPU的深度學習推理部署優化實踐深度學習優化
- volatile的語義與實踐
- 機器如何「猜你喜歡」?深度學習模型在1688的應用實踐深度學習模型
- 深度學習在攜程搜尋詞義解析中的應用深度學習
- AI在汽車中的應用:實用深度學習AI深度學習
- Opencv學習筆記(3)---紙牌數字識別練習實踐專案OpenCV筆記
- 愛奇藝深度學習雲平臺的實踐及最佳化深度學習
- 網易易盾深度學習模型工程化實踐深度學習模型
- 淺入淺出深度學習理論與實踐深度學習
- 美團“猜你喜歡”深度學習排序模型實踐深度學習排序模型
- 深度學習之雙DNN排序模型:線上知識蒸餾在愛奇藝推薦的實踐深度學習DNN排序模型
- 高德技術團隊:深度學習在導航速度預測中的探索與實踐深度學習
- 深度學習在高德駕車導航歷史速度預測中的探索與實踐深度學習
- 深度學習 SSD的理解和細節分析深度學習
- 用三張圖理解深度學習的工作原理深度學習
- 深度學習DeepLearning.ai系列課程學習總結:9.深度學習基礎實踐理論深度學習AI
- 如何用深度學習做自然語言處理?這裡有份最佳實踐清單深度學習自然語言處理