電網行業,如何應用自然語言理解技術?

AIBigbull2050發表於2019-11-17

本文分享了智慧電網的發展現狀與未來趨勢,並且具體講解了自然語言理解技術在電網行業中的應用。

電力網(電網)是高效快捷的能源輸送通道和最佳化配置平臺,是能源電力可持續發展的關鍵環節。在現代能源供應體系中,電網發揮著重要的樞紐作用,關係國家能源安全。2010年以來,國家電網的規模增長近一倍,保障了經濟社會發展對能源電力的需求。

隨著人工智慧技術的快速發展,機器智慧的優勢正逐漸深入各行各業。本文將聚焦中國市場,談談自然語言理解技術在電網行業當中的應用現狀與發展前景。

自然語言處理(NLP)技術旨在研究透過計算機裝置理解,處理,應用人類的語言文字資訊內容,是人工智慧研究領域中最為典型也最具挑戰的一個部分。

目前,國家電網正在試圖將NLP技術運用到電網相關的服務工作當中,透過技術的力量,加速電網行業的發展。

智慧電網泛指藉助人工智慧技術實現的智慧化電網。它基於整合的高速雙向通訊網路,透過先進的控制方法和先進決策支援系統技術的應用,以可實現更可靠,更安全,更高效,為目的的電網服務。從而保障了廣大使用者額電能質量,推動電力市場的發展。

透過文字閱讀理解,文字相似度計算,知識圖譜等技術,在專案招標,檢測預警,維護修理,以及渠道客戶等電網業務的應用場景當中落地。提升電網業務的工作效率,造福廣大人民群眾。

01 市場規模與發展趨勢

2005年以來,智慧電網的關注度不斷提升,這是現代電力系統日益複雜的體現。智慧電網的概念是科研技術、解決方案,以及政策和監管機制的合集。未來幾年,新能源裝機和發電量佔比的提升將是一個必然的趨勢,電網將圍繞著清潔能源,進行系統化的投資升級。另一方面,中東部地區興起的大量間歇性分散式電源併網也需要智慧配電網路的支撐。

我國智慧電網市場的需求方主要是國家電網,南方電網,以及地方供電局和一些地方電力公司。目前,市場上有能力提供較為全面的智慧電網解決方案的供應商還十分有限,但是,我們也看到絕大多數企業都已經開始在某個或多個細分領域逐步展開智慧化的戰略部署。

資料來源:國家電網 前瞻產業研究院

02 相關技術介紹

文字資訊抽取

文字資訊抽取主要是結合機器閱讀理解,透過訓練Word2vec模型,將文字資料中有效的資訊識別出來,實現自動從文字資料中識別並提取關鍵資訊內容的功能。

文字資訊抽取的技術可以應用於電網招標文件資料的結構化儲存,便於招標文件的聚類和整理。同時也適用於電網企業說明文件的檢測警報等任務。

文件相似度分析

文件相似度分析是依賴文字內容語義相似度計算的技術實現的一種典型NLP任務,一般用於資訊檢索和知識問答的模糊匹配。

這項技術正嘗試被運用於電網維修行業,維修人員可以透過提問,或關鍵字/詞搜尋的方式對資訊量龐大的電網維修說明文件進行快速的檢索,系統可以找到精準的相關內容,並生成說明內容返回給為維修人員。

知識圖譜

知識圖譜是指包含不同實體之間的資訊和語義關聯的知識庫,能夠有效的將系統當中的知識類資訊進行整理與關聯,從而實現資訊資料的相互聯結與溝通。

針對包含專業技術和知識類文字資料組建圖資料庫,從而實現複雜的檢索功能和智慧輔助決策的功能。

透過圖資料庫提升文字資訊的檢索質量,可有效的運用於電網管理監控,電網知識類智慧問答客服等場景。

情感識別

感情識別技術指的是透過對工作業務當中對話內容資訊的聚類和理解,識別使用者在對話內容中所表達的情感資訊的技術。

感情識別技術主要依靠長期短期記憶(LSTM)演算法,對相關業務對話語料的上下文資訊進行深層理解,結合對話當中的語境資訊,判斷對話內容中所表達的情緒正負極,進而理解對話內容的話題與意圖。

03 應用分佈與產品案例

電網檢測警報

(江蘇電網與河海大學)傳統的電網檢測警報無法對在短時間內對發生的警報事件做出準確的判斷。鑑於目前監測報警資訊效率低的現狀,人工智慧技術為電網業務提供了有效的解決方案。

首先,透過NLP技術對報警資訊文字的特徵進行分析和整理,並做好預處理工作。

之後,基於Word2vec模型對監視警報資訊進行向量化。

最後,針對報警資訊的特點,建立了基於LSTM和CNN組合的監控報警事件識別模型。該模型可以透過與多種識別模型的比較,以驗證本文方法的可行性和有效性。

智慧電網檢修問答系統

(南方電網與薄言科技)透過機器閱讀理解技術將電網安規的文件進行讀取和分析,然後為文件中的段落建立索引。

當電網維修人員向系統提問後,系統會先在索引裡搜尋相關段落,再從找到的段落中讀出問題答案系統依賴bert 模型預測出來文章當中哪一段能回答這個問題的機率最高。(學術的閱讀理解資料集上,人能做到86.8, 最好的模型做到88.6了)。

搜尋返回的是段落,系統將段落內容轉精煉成回答短語,也就是說,系統會先理解文字內容,之後再抽取原文的一部分內容作為答案輸出,返回給維修人員。

電網維修人員可以透過自然語言互動的方式快速查閱電網維修文件,從而有效提升電網維修任務的工作效率。

智慧電網招標資料查重系統

(國網江蘇省電力公司電力科學研究院)電網公司在專案招標採購過程中, 一般要對招標資料進行查重工作,在歷史專案資料庫中查詢是否存在類似專案,以防止專案重複招標的情況發生,避免資金浪費。

使用潛在語義索引的方法, 對文件中的語義進行分析。使用NLP領域的中文分詞、詞向量轉換、詞權重計算、主題建模等技術構建一套文件相似度分析系統。該系統可在海量歷史專案資料庫中快速找出與目標文件相似的專案,並計算出文件相似度百分比,輔助招標採購專職工作人員判斷招標資料是否合規。系統的研究與應用,對規範電網公司專案招標採購管理具有重要的實用價值。

侷限性與發展趨勢

NLP技術在電網行業當中的應用才剛剛起步,大多數案例還處於實驗和探索階段。當前,真正在實際場景中落地的專案非常有限,相關的進展主要來自科研高校以及科技公司的POC專案當中。這些專案當中的資料多為實驗資料,缺乏一定的客觀性和普適性。從目前的發展現狀來看,電網行業中資料的獲取和整理將會是一個較大的挑戰。

電網領域的內容具有一定的專業性,且需要進行大量有效的人工標註才能訓練出一個有效的模型。

此外,電網公司是比較傳統的能源類企業,其工作方式以及工作系統已經形成體系。因此,相對於其他行業來說,電網業務智慧化的成本更大,門檻更高。短期之內,NLP技術在電網行業中的應用依然是以協助人類工作為目的,而這同樣需要相關從業人員接受並掌握新的工作形式與模式。

事實上,中國國家電網和南方電網等行業領頭者已經在積極的與多家科技公司和院校實驗室進行合作,共同探索人工智慧技術在電網電力領域的應用,旨在推動電網電力智慧化的戰略方針,更好的服務於百姓。未來,將會有更多電網業務相關的資料被挖掘和記錄,NLP技術的主要應用場景將不再僅僅是輔助業務的智慧客服中心。屆時,智慧技術將會進一步的深入到電網相關業務具體的管理檢測和維護當中。





來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69946223/viewspace-2664510/,如需轉載,請註明出處,否則將追究法律責任。

相關文章