政策智慧分析詳解,達觀RPA、NLP、知識圖譜技術多場景落地應用

達觀資料DataGrand發表於2021-06-25

場景_meitu_2

瞭解分析政策不僅能幫我們描繪出政策變遷的路線圖、瞭解國家各時期的發展重點,還能在分析過程中幫我們發掘其背後的規律,發現政策的演變軌跡,從而對政策趨勢進行量化呈現與規律性預判。
2014年12月01日釋出的《國務院辦公廳關於加強政府網站資訊內容建設的意見》,明確要求各級政府要將政府網站作為政府資訊公開的第一平臺,第一時間釋出政府的政策資訊。基於以上政策要求,政策資訊、政策資料的公開透明化是合法、合規且必須的,政策文獻不再塵封於“深宮密闈”之中。
當分析政策時,首先要解決的就是政策資料的獲取、梳理的工作,手工整理、分析政策資料不僅工作量大、且難免保證不會出錯,利用傳統的爬蟲工具也可能導致頻繁的封IP,網站版式變更、升級會導致爬取策略失效、出錯,維護成本較高,甚至還有可能帶來其他安全風險,採購第三方的政策資料則面臨不菲的採購費用,而且後續資料的更新依賴性也較強。
隨著近年來AI技術的發展,大型機構已經在政策資料獲取、資料加工整合、資料分析展示等取得不錯的成果。下文將從政策分析的不同場景出發,詳解達觀資料在政策資料獲取、政策資料加工等方面的實踐。

場景一、RPA智慧獲取政策資料

RPA“Robotic Process Automation(機器人流程自動化)”它透過模擬人的滑鼠、鍵盤操作,代替人與業務系統進行互動,能自動完成規則明確、重複性高的業務流程,可將人類重複枯燥的基礎性工作效率提高n倍,達觀RPA上手簡單,沒有程式碼基礎的人員也能完成相關的配置。 在政策分析領域的應用上,RPA可完全勝任政策資料的採集、整理、彙編、入庫等一系列操作。而且達觀RPA在系統之間整合方便、軟體是非侵入式、安全、高效,不會給相關網站造成安全上的隱患。
場景1
達觀RPA技術”在某政策智庫專案上,從政策資料的採集到加工、展示等方面的成熟應用

場景二、NLP智慧實現資料分類

政策資料獲取到之後,往往需要根據政策內容,把多源異構的資料進行統一類目的梳理,如做資料的打標或者分類,比如可以根據政策內容可以分為基本政策、政治政策、經濟政策、社會政策、科技政策、文化政策、產業政策等,便於政策的檢索和更有針對性的分析。

場景2

達觀NLP的文字分類元件,讓計算機透過預先閱讀各個類目的文件並提取特徵,完成有監督的學習,從而計算機能夠自動的完成新政策的內容歸類。例如上圖為透過“達觀NLP標籤模型”按照國民經濟行業分類體系對政策資料進行自動分類。

場景3

達觀NLP文字分類技術”將政策智慧分類在某智庫系統的展示效果

場景三、達觀NLP智慧擴充政策主題詞

政策文獻存在“主題詞”結構要素,這一結構要素的詞彙主要來源於國務院、科技部、教育部公文主題詞表等規範性資料。如“脫貧攻堅”“一帶一路”。
政策文獻“主題詞”起初是為了滿足公文歸檔與分類的需要,有數量稀疏、詞彙老化、對政策內容的揭示性不足等現象,如國務院主題詞表786個,自1988年修訂一來無更新,若完全遵循國務院公文主題詞表,就會遺漏很多政策文獻的重要資訊與變化,因而政策分析需要在原有政策文獻“主題詞”的基礎上進行更新補充。
“達觀智慧主題詞提取模型”透過NLP(自然語言處理)技術,不僅可以統計“主題詞”頻次的高低,更能綜合考慮詞彙的獨立表義性、逆文字頻率、詞性等因素,從而一定程式上揭示政策主題的熱度與潛在關聯。例如達觀智慧主題詞提取模型”對習主席出席“一帶一路”國際合作高峰論壇演講稿《攜手推進“一帶一路”建設》進行分析後,得出的主題詞如下:
場景4

場景四、達觀知識圖譜智慧展示政策關係

政策文獻及其關聯關係經過一段時間的積累後,會形成複雜的關聯網路,政策分析者需要挖掘政策間的內引規律,驗證定性的主觀判斷,呈現政策演變軌跡。
這是一項非常龐雜的工作,僅依靠文字、手工記錄幾乎難以實現。達觀在服務客戶的過程中,主要是利用RPA結合知識圖譜技術、NLP技術, 在政策資料的加工處理過程中,挖掘出政策間的引用、衍生關係,把非結構化的政策資料轉化為圖關係型資料,最終為政策分析者提供便捷、視覺化的政策圖譜網路。以下為達觀知識圖譜技術”依據《國務院關於加快推進“網際網路+政務服務”工作指導意見》為政策主題,衍生出的政策關係圖譜。
場景5
 
除了上文介紹的RPA、NLP、智慧圖譜在政務行業的應用場景之外,達觀智慧辦公機器人產品矩陣已覆蓋金融、法律、運營商、電商、文娛等眾多行業的多場景智慧化解決方案。透過機器人流程自動化(RPA)、自然語言處理(NLP)、共光學字元識別(OCR)、知識圖譜、智慧搜尋、智慧推薦、文件智慧審閱等自動化與人工智慧技術的結合,未來,達觀資料也將繼續助力企業快速實現智慧化升級。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69997703/viewspace-2778372/,如需轉載,請註明出處,否則將追究法律責任。

相關文章