這個遠比安防更難攻下的領域有著自己的「遊戲規則」|深度

微胖發表於2018-05-29

都知道中國全科醫生缺口很大,但是,你知道中國法官的工作量有多可怕嗎?

這是北京海淀區法院溫泉(金融與清算)人民法庭陳聰慧法官團隊 2017 年辦理案件的部分卷宗。

這個遠比安防更難攻下的領域有著自己的「遊戲規則」|深度

去年一年,這個團隊收案共計 3012 件。大多都是不太好啃的「硬骨頭」,最後審結2700 件案件。這個數字相當於某些地方一個法院全院的工作量。

這個遠比安防更難攻下的領域有著自己的「遊戲規則」|深度

這並非個案。

過去的五年時間當中,法院的立案量和辦案量都有很大程度的攀升。

全國審結案件共計有 8598.4 萬件,同時結案的標的額現在達到了 20.2 萬億元,並且這個數字還在以每年 15%-20% 速度在增長。某些法院在年度結案上的增長速度已經達到了 40% 。

而全國法官只有 12 萬人。算下來,每位法官要在三天不到的時間裡完成一個案件的辦理。

在這樣的應用場景下,人工智慧技術解決的是一個不折不扣的剛需,也是「網際網路+」無法解決的問題:提升工作效率。

據報導,陳聰慧團隊去年一年出具的 1440 份判決書中,有近 1100 份是透過技術手段製作完成的。

不過和 C 端業務不同,對於電子政務領域的供應商來說,高層釋放出明確政策訊號才意味著可靠的市場需求。

2016 年,最高人民法院院長周強正式提出要積極推動人工智慧在司法領域的應用。隨後,「智慧法院」這個提法出現在國務院 2017 年 7 月印發的《新一代人工智慧發展規劃》中。

在這樣一個大的背景下,「法檢資訊化建設」的頭部公司華宇軟體於前不久正式釋出了國內首個法律 AI 平臺, 以及以此為基礎的智慧法院產品。

這個遠比安防更難攻下的領域有著自己的「遊戲規則」|深度

法律人工智慧平臺可以賦能電子卷宗、證據分析等七個法院行業通用的業務服務,為法院行業智慧立案、智慧審判、智慧法庭、智慧執行、智慧審管、協同辦案、電子訴訟、智慧司法等八個重點應用場景提供服務。

這個遠比安防更難攻下的領域有著自己的「遊戲規則」|深度

法律 AI 平臺由睿元、智核和睿核組成。

睿元,其實就是華宇大資料管理平臺,負責管理資料,也是過去技術經驗的總結。

真正負責人工智慧擔當的,主要是後面兩個部件:

智核,華宇人工智慧感知平臺。主要負責整合通用 AI 能力,比如,語音識別人臉識別

人臉識別可以用於多種業務應用場景,如訪客登記、自動終端登入、機器人引導、視窗談話、業務軟體刷臉登入、庭審身份核實等。

而利用影像 OCR、基於深度學習的影像分類和目標檢測、實體識別等技術,可針對卷宗檔案實現智慧識別分析。

睿核,華宇人工智慧認知平臺。以法律知識圖譜為基礎,利用自然語言理解和機器學習技術,幫助機器從自然語言描述中,認知具體的法律概念、關係主體等,即讓機器能夠讀懂法律文書,輔助法律人開展工作,比如,實現更加精準的類案推送。

睿核也是華宇過去投資人工智慧成果的集中體現。

法律人工智慧平臺可以賦能電子卷宗、證據分析等七個法院行業通用的業務服務,為法院行業智慧立案、智慧審判、智慧法庭、智慧執行、智慧審管、協同辦案、電子訴訟、智慧司法等八個重點應用場景提供服務。

這個遠比安防更難攻下的領域有著自己的「遊戲規則」|深度1871結構

「一系列的產品互相整合的一個龐大的複雜系統,這跟過去不一樣。」北京華宇資訊科技有限公司副總經理米坤告訴我們。

這個遠比安防更難攻下的領域有著自己的「遊戲規則」|深度北京華宇資訊科技有限公司副總經理米坤

目前只能實現弱人工智慧

正式釋出之前,這套智慧法院產品已經中標了一些法院系統的大訂單,比如北京高院、甘肅高院。並在一些法院推廣使用開來。

其中類案推送,是大家比較關注的一個審判輔助功能。

比如,庭審結束後,人工智慧會對案情要素進行進一步提取,根據法官進一步認定的內容,給其推送更為精準的相似案例、裁判尺度、法律法規等服務,最終幫助法官完成裁判文書撰寫。

從效果上來看,「可以將案例推薦匹配度從 20% 提升到 90%,實現精準推薦效果。」

不過在學界看來,目前系統所能實現的類案推送還沒有真正抓住痛點。

「法官在檢索的時候,對兩個案件類似的興趣不大,而且找到之後,還有大量案子裁判結果不一樣,找到類似案件,對他而言反而有麻煩。」四川大學法學院王竹教授認為,法院對類似的爭議焦點更感興趣。

但在米坤看來,「倆人打架,不管是道理判斷還是法律邏輯,人可以大致做一個判斷,誰吃虧了,誰具有優勢。但是,機器判斷不出來。」

米坤認為,以爭議作為痛點,很好,但找到爭議點極難,尤其是用機器的方法。

目前,智慧法院的類案推送離不開華宇自研的法律知識圖譜技術。

在知識密集型行業(比如法律、醫療、金融、電商等),知識圖譜是系統實現一定推理能力不可或缺的步驟。雖然目前法律行業都想做這個方向,但鑑於技術難度,並非所有人都可以做出來。

這個遠比安防更難攻下的領域有著自己的「遊戲規則」|深度

知識圖譜是構建法律 AI 的基石,構建法律的智庫雖然很難,但我們在堅持不懈地走。」米坤說。

不過,專業領域內的知識圖譜構建尚處於初級階段,還要經歷非常長時間的發展。

研發過程中,華宇做了很多試錯。「最終還是要回歸到弱人工智慧的標註再加上機器學習。」米坤說,無監督學習的路子走不通,因為需要應用的人員不斷地去使用它,但在法律行業,這種可能性基本不存在。

「如果這個案件資訊回填不準,他們就不會用。」米坤說,「法官不會當小白鼠。目前來講,應該沒有其他捷徑。」

目前的 AI 系統仍然是水平很低的智慧化。

「你是專家,基於你的經驗做一個系統,然後用了一些新的技術,比如說機器學習,讓比它能力低的人,或者跟它能力相當的人也能夠快速地得到一樣的審判結果。」米坤解釋道,

「目前來講,只能走到這一步,還遠遠達不到真正基於行為、動機和資料催生人工智慧。」

產品設計中的平衡

與會的清華大學法學院教授勞東燕認為,眼下的法律產品的設計和開發,可能還尚處在淺水區。

對於具體法官來說,很多時候,基於當前大量資料的類案推送沒有太大意義。它們唯一的意義在於「事後控制」

比如,法官可以知道全國同類案件中,他的這種判決包括量刑的偏離程度如何。

「深水區要在案件質量上下功夫……在司法處理上,最重要的就是同案同判。」勞東燕坦言。

這個遠比安防更難攻下的領域有著自己的「遊戲規則」|深度左二為清華大學法學院教授勞東燕

撇開技術上的實現難度不談,從產品設計角度來說,這也是一個路徑選擇問題。

「選擇錯之後,研發出來的產品沒人要,這是現在迫切要解決的問題。」米坤說。而在華宇看來,效率提升可以透過技術解決,判決質量要依賴法官素質。

「在當前案多人少的情況下,我們只能找到有效的技術手段來處理,但不影響裁判質量或者審判質量。」米坤說。

而上述矛盾,只是電子政務產品設計中需要思考的矛盾關係之一。

「過早投入、過度投入都是浪費,這個供應需求什麼時候實現,其實達到平衡點很難。」米坤說。

智慧法院的智慧化與移動化設計,也儘可能平衡了成熟技術與未來趨勢,最大程度將公司至於一個相對主動的競爭位置。

「雖然我們也在說一定要用過去成熟的技術,但是,未來的資訊科技裡面,一定要有新的要素,要有業務驅動,比如提高效率。」米坤說。

「不同場景下,智慧支撐著一些工具和一些應用點,這是與過去系統最大的不同。」

這個遠比安防更難攻下的領域有著自己的「遊戲規則」|深度

至於移動性,「這是一個體系化思考的結果。」米坤說。

過去的產品部署在 PC 端,但資訊是流動的,網路並無牆內和牆外。現在,微信上有 7 億人群,包含各類人群。而在 5G 時代,現在有線端的應用可能會在移動端成為常態。

「所以我覺得移動是未來很重要的一方面,作為智慧法院來講,智慧化和移動化,是很重要的兩個方面。」
這個遠比安防更難攻下的領域有著自己的「遊戲規則」|深度在行業發展趨勢上,華宇認為,互聯可以帶動未來 3 年的司法機關資訊化需求。

華宇上一代的系統,點點之間可能有協同。「十年之前,技術上(實現協同)一點沒有問題,障礙完全在於資料對接不暢。」米坤說。

現在,司法機關係統出現互聯趨勢。最近,華宇在三個省的政法系統拿到了互聯專案以及互聯後的大資料分析專案。比如,貴州、浙江、 蘇州政法大資料協同辦案平臺專案等。

這一次,華宇大膽立足於公檢法司在刑事案件全流程業務角度,進行產品設計。

「從系統角度已經做好了這樣的設計,只要行政命令一下,這個系統就能用。」米坤說,

「用這樣的一種方式為未來管理改變做好準備,如果人家真有這個需求了,還要推倒重來,這就很被動了。」

這個遠比安防更難攻下的領域有著自己的「遊戲規則」|深度

除此之外,平臺化也是一家行業頭部公司會考慮的問題,平臺化不是網際網路公司的專利。

「技術角度上,平臺化很大的好處是可以把品牌研發和需求定製做進一步的分離。讓法院建立一個松而活的體系,能夠持續不斷根據業務的需求修改某個平臺。以前是修改一個模組,對所有的模組都要重新編輯,現在不是。」

華宇也會考慮開放自己的技術平臺。「如果第三方開發出好東西,只要它符合規範和稽核的標準,都可以整合到華宇平臺上來。」

這個遠比安防更難攻下的領域有著自己的「遊戲規則」|深度

這是個比安防門檻高得多的行業


法院資料比醫療的資料質量好很多。全國的諸多法院在經過 20 年的資訊化建設後,流程資料、證據資料、文書資料、檔案資料等都非常完整。

因此,一些 AI 公司也進入到這個領域。

2016 年 12 月,科大訊飛與最高人民法院資訊中心達成戰略合作。科大訊飛牽頭用人工智慧構建智慧法院超腦系統,推出包括智慧語音、便民服務、大資料分析、電子卷宗、輔助辦案等多類系列產品在內的智慧法院整體產品方案。

一個傳統問題再度被提及:法律 G 端市場的未來格局會有什麼變化?

華宇認為,和科大訊飛這樣的「 AI + 行業」企業不同,華宇屬於「行業 + AI 」。

「在這一行業上深厚的業務基礎是與競爭對手最大的差別,對方缺乏行業積累和對業務的理解。」米坤說。

對於行業市場,核心是透過技術解決問題。打造解決方案的時候技術不是最重要,最重要的是對於客戶痛點的瞭解。

比如,一款產品無法滿足使用者需求,一方面可能是供給側的問題,比如研發時沒有做深度調研和驗證。但不少時候,也是政策變化太快的原因,而這種情況更為常見,也是這個行業的特殊之處。

以司法員額製為例。

員額制下的審批方式,人員比例是 1:1:1。但現在並沒有不同型別、繁簡程度案件下的工作機制、工作職責和工作關係。

「這些東西都沒有,怎麼做軟體?沒法做。做軟體一定是一定規律、規則要求之下才能做,計算機再人工智慧,也代替不了人的思考。」

而法官的文科思維與軟體工程師的理工科思維之間的巨大差異,也是這個行業的一個特點。

「不同法律部門之間,隔行如隔山,法律跟技術怎麼更好的融合?這是一個非常難的問題。」米坤坦言。「我們也要學習文科人的思維邏輯和方式。」

除此之外,還需要掌握一定的法律專業知識。

「我們要看人大報告,法院和檢察院的報告都要看。司法解釋、法律法規、政策要求、規章制度檔案,我們全要看,畢竟我們能看懂。有了這些積累,我們才能把自己劃為法院行業的資訊化。」

截止目前,華宇業務覆蓋全國 31 個省超過 3000 多家法院客戶。公司派駐在法院駐地的人員有 1000 多人。

「客戶有那麼多需求,不管是被動的,還是主動找我們做什麼事,第一時間會到我這來,我就能判斷出來這個方向在哪裡,在我們這經過分析加工,找到一個合適的方向去研發,去滿足這樣的市場需求。」米坤說。

而另一方面,我們也必須承認一個客觀事實:B 端客戶更換服務的決策成本很大,現實操作成本也很大。這也是無形的行業門檻。

一位高等法院的朋友曾告訴筆者,由於兩套系統的關鍵詞都不一樣,在更換系統時,他曾與同事一點點手動更改輸入的。「工作量非常大,換套系統的成本太高。」

「過去的 22 年,是把一個年輕人變成了滿頭白髮的過程。」米坤感嘆說,「法院業務的門檻,比安防還要高。」

除了行業積累,華宇也有自有技術。除了法律知識圖譜技術,還有司法大資料融合技術。

這個遠比安防更難攻下的領域有著自己的「遊戲規則」|深度

「案件資訊太多:主體資訊、文書資訊、證據資訊,又分人證、物證。它們本來就是一個結構化、半結構化等非常複雜的資料集,又加上很多的法律法規和司法解釋,司法解釋又分為不同年代。怎麼把這些複雜的資料以案件為中心,以訴訟主體為中心建立起關係,這本來就是一個極難的過程。」米坤說,

「它跟知識圖譜有關係,如果沒有這樣的一個模型,就不能建立關係,兩個之間是相互的過程。這塊是我們很獨有的技術,這是我們 20 年的積累才會做這樣的模型,因為在法律方面,除我們之外,還沒有人做。

目前,華宇分佈在各個分子公司中從事法律人工智慧、大資料研究的研發人員大約有 500 多人。研發預算每年 2 億左右,一半與大資料、AI 相關。
這個遠比安防更難攻下的領域有著自己的「遊戲規則」|深度

雖然相比 C 端客戶,獲得 B 端客戶相對容易些,但是華宇也有佈局律師、公司法務產品市場。旗下華宇元典的律師平臺正承載越來越多功能和智慧服務。

「百姓市場呢?」我問道。

「中國老百姓去打官司,更願意找個律師、找個人,而不是找個機器律師。」米坤說,

「這是個文化問題。中國人的文化根子第一是不願打官司,第二是打官司要見到人,所以中國人基於規則這方面的社會治理生態來講,還需要走很遠,不太容易。」

相關文章