如何用NLP與知識圖譜支援MarTech建設?

百鍊智慧發表於2019-06-17

所有人都向往無所不知,營銷尤為如此。

不同的是,營銷人追求的「無所不知」更像對洞察和精準的執著——無論是大到使用者資料管理,還是小到銷售線索的篩選,營銷人希望知道更多,從而減少銷售轉化過程中的損耗,提高效率。

由於語言文字是人類社會資訊傳遞的主要形式,當人們交流、儲存資訊的主要場地逐漸偏向網際網路,觸及「無所不知」的方法也在這裡被漸漸發掘——人工智慧領域的發展可見一斑:

自然語言處理(Natural Language Processing,簡稱NLP)技術探討的基本命題是如何處理和運用自然語言。而知識圖譜則是在NLP對語言文字的解構基礎上,以圖資料形式儲存資訊,並描述客觀世界中概念、實體及其關係。

簡單來說,NLP技術類似於人類讀懂語言和文字的能力,而知識圖譜則對應著人類儲存在腦海裡的知識體系。

於是,AI投資熱潮過境之後,高投入、低迴報、落地難的固有印象讓這個領域短暫失去了吸引力。但在資本眼中,兩個細分領域仍然存在大量的機會,一個是計算機視覺(CV),另一個就是自然語言處理(NLP)。

自然語言處理知識圖譜是兩顆相輔相成的AI雙子星,在MarTech領域已經找到了幫助營銷人「無所不知」的方法:智慧獲客。

從智慧獲客快速落地的NLP

在Google開源BERT後,NLP行業迎來了自己的標杆模型,識別精準度大幅提升。再加上網際網路世界中文字資料普遍,又存在大量如搜尋等垂直領域的需求,該技術受到VC青睞理所當然。

但作為NLP技術重要的應用之一,知識圖譜在不同環境下卻表現出不同的形態,一方面,「Google知識圖譜」試圖還原整個現實世界聯絡,敘事恢弘,另一方面在MarTech領域,知識圖譜的應用則從更貼近商業本質的一面展示價值,那就是智慧獲客。

智慧獲客,同時對Marketing與Sales部門產生影響:Marketing負責為銷售匯入優質潛線上索,屬於線索管理(Lead Management)範疇。而銷售部門也需要對已有資料做進一步篩選,這屬於銷售支援(Sales Enablement)的範疇。 

IDC分析師曾認為,銷售支援(Sales Enablement)其實就是「在正確的時間以正確的格式向正確的人提供正確的資訊,以幫助推動特定的銷售機會。」對於銷售部門而言,這往往需要能夠連貫地組織、查詢、共享、定製和分析目標的必要框架。

在業務場景中,「正確」並不容易達成——事實上,大多數企業地銷售資料很容易給銷售人員造成紊亂,一般造成這一現象的原因有三: 

  • 銷售線索往往由多個團隊輸入,內容良莠不齊,導致目標畫像不全

  • 行業資料資訊龐雜,商業關係還原難度大

  • 潛客篩選、銷售線索優先順序劃分困難 

而這些痛點也為NLP和知識圖譜的應用提供了豐富的應用場景。

「以銷售為導向的企業,每天各個渠道都會產生大量的銷售線索。幾百人的銷售團隊,每天可能需要面對上萬條參差不齊的線索。行業需要一套解決方案,能幫助銷售人員自動補齊線索內容、自動挑選更有價值的銷售線索優先觸達。」百鍊智慧聯合創始人&CTO姚從磊在接受採訪時這樣說道。

在姚從磊看來,銷售線索是ToB銷售側的痛點之一,百鍊智慧據此打造了自己的智慧獲客四大產品:競爭分析、檔案補齊、模型預測和客戶裂變。

如何用NLP與知識圖譜支援MarTech建設?

「檔案補齊是透過知識圖譜的實體對齊技術,對殘缺不全的銷售線索進行自動化補充整理;而以NLP技術處理後的銷售端成單資料和銷量資料為基礎,我們可以透過建立深度神經網路模型幫助客戶實現成單和銷量的預測;此外,基於全網公開資料,知識圖譜能帶來客戶竟對關係的提煉和KP的鎖定,輔助銷售工作。」姚從磊補充道。 

把資料轉化成業務語言 

由此看來,知識圖譜在銷售支援領域的應用,已經涉及到資料收集、資料治理以及資料分析三個環節。在實際輔助銷售人員的過程中,知識圖譜技術承擔著將銷售大資料轉化成「業務語言」的重任。

例如,客戶過往成單總的資訊,返回到客戶模型中,成為能夠基本定性的資料,如公司規模、地理位置附近存在競對產品的數量等。隨後這些資料進入到深度學習神經網路模型,最終形成應用標籤,最終預測銷量。

但在ToB企業銷售部門,知識圖譜也有自己發展的不利因素,如可供訓練模型使用資料量相對較少,不同行業資料型別差異較大等問題。 

在被問及這些問題時,姚從磊表示訓練資料較少的問題確實存在,但只要資料規模能保證在千級,知識圖譜+模型就能產生相對有效的標籤支援。另外,GAN (對抗生成網路)技術能幫助模型在較少訓練資料下,獲得較高的預測準確率。 

而不同行業的資料型別不同的影響並不大,知識圖譜產品的服務模式是可以切換到其他行業的,需要調整的只是資料刻畫和分析的維度。

「我們從一開始只做銷售線索的篩選匯入到如今,一年時間裡已經開始與部分客戶合作進行銷量預測。」姚從磊說,「接下來,我們會逐步將自然語言處理技術的召回率提升到較高的水平(平均98%以上)並部署GAN (對抗生成網路)」

消費者全量資料的知識圖譜暢想

對於那些具備通用產品,客戶群大而分散,且有篩選銷售目標需求的使用者,知識圖譜是一個見效迅速且成本不高的銷售效率提升之法。 

百鍊智慧選擇了從智慧獲客切入,同時在銷售支援(Sales Enablement)與線索管理(Lead Management)的細分賽道上不斷深耕。但對知識圖譜而言,如果將「銷售資料」換成營銷「全量資料」,那麼NLP和知識圖譜技術對Martech的影響會更加廣泛。

銷售業務場景下,人們主要工作內容是拜訪客戶。在拜訪完一家客戶後,銷售人員往往需要了解就近還有哪些客戶,這意味著基於地理位置的對潛客的篩選能夠幫助到銷售人員,而地理資訊僅僅是一個維度。

如果將地理位置、競對關係、人事變動、近期行業資訊等公網「知識圖譜」,與目標客戶的網頁瀏覽URL、APP行為、第三方平臺行為等營銷「知識圖譜」結合起來,營銷人員將最大限度地「在正確的時間,像正確的人傳達正確的資訊」,銷售人員也將最大限度地「在正確的時間,正確的地點,接觸正確的人,提供正確的產品資訊溝通」,最終雙方協同推動特定的銷售機會。

這是比較理想的基於消費者全量資訊建立知識圖譜的情景——高精度的知識圖譜必然需要NLP技術與強大的AI模型共同實現,如消費者訪問海量的URL資料,首先需要用爬蟲獲取頁面內容,再透過NLP語義識別為每一個URL貼上相應標籤。

隨著CDP、資料中臺概念的興起,廣告主越來越關注第一方資料與第三方資料的結合,建立自己的私域流量池。但在全量資料面前,資料標籤打通成本高、難度大,也限制著廣告主建立自己的洞察。

知識圖譜,可能就是那條捷徑。

相關文章