撰文 | 微胖
採訪 | 高靜宜 微胖
Luis Salazar 是邁阿密一家 5 人小型律師事務所的一名合夥人。搜尋線上法律資料庫 10 個小時後,他很快就發現了一宗與他手頭案件極為相似的破產案例。在輸入一個法律問題後,系統表示將在一天後給出答案,其中包括一小段總結,以及兩頁的解釋備忘錄。後來,他發現這個結果與律師撰寫的備忘錄並無二致。
Luis Salazar 使用的這個系統就是 ROSS Intelligence,世界上第一個人工智慧法律助理。目前,Ross 客戶包括諸如 Latham & Watkins、Dentons、 BakerHostetler 和 Briesen & Roper 這樣的 AM Law 200。去年 11 月,Salazar 開始在破產案件中使用 Ross Intelligence 的軟體,「確實有點嚇人。如果它做的更好,許多人可能會因此失業。」他說。1999 年是美國律師行業的黃金時期。當時一宗大型專利案件,可能需要 3 名合夥人、5 名合作人和 4 名法律助理。如今,相同的案件只需要 1 名合夥人、2 名合作人和 1 名法律助理。
近期,麥肯錫全球研究院(McKinseyGlobal Institute)研究發現,雖然當前技術足以讓近半數工作自動實現化,但是,只有 5% 的工作崗位完全自動化。研究預計 23% 的律師工作能被自動化。中國法律行業也開始這一領域的探索,並隨著 2014 年 1 月 1 日起開始實施的裁判文書全部公開而加速。
7 月 28 日,國內外共 600 餘人參加了由杭州錢塘智慧城管委會與上海百事通訊息技術股份有限公司(以下簡稱「百事通」)主辦的「2017 『法律+科技』領軍者國際峰會」。來自不同領域的學術領袖、商業機構使用者代表、司法機關實踐者、法律網際網路精英、優秀律師以及頂級法務經理人,共同探討了人工智慧、科技與法律行業創新發展。
上海百事通創始人馮子豪
法律 AI 是一片創業藍海
「美國法律服務市場規模很大,中國現在只有 800 億的規模,美國是 14000 億美金,差距很大。」方廣資本管理合夥人兼CEO 洪天峰說,「我們覺得未來十年,中國市場會迅速成長,規模會達到 5000 億。」
每天世界上創造的資訊量是 2.4 兆億。也就是說,每天早上醒來,開啟門,你會發現門外堆著 340 份報紙,這是我們每天必須要接觸的資訊量。「中國有 257 部現行國家級法律,9915 部地方級法規,642 部行政法規,約500 件司法解釋,還有 2000 萬裁判文書。在美國,除了聯邦法,50 個州也有自己法律。」百事通智慧產品研發負責人夏澎舉例說。
「律師就比奴隸稍微好一點。」美國德傑律師事務所中國管理合夥人陶景洲感慨道。文件電子化減輕了物理負重,但是,以電子證據開示為例(E-Discovery),很多案件中,需要分析的資料量超過 100GB,經常只有 5% 到 10% 與案件真正相關。
從法律服務消費者角度來看,服務供給也存在不少問題。「訴訟案子每年穩步提升,但是非訴訟案子很少。尋求法律服務過於麻煩,抑制了大量需求。」洪天峰說。「在美國,百分之八十的法律需求方付不起法律服務的賬單。世界上的其他地方也存在類似情況。這個數字很驚人。如果歷史性回顧法律服務價格,它是在上升的,但這並不該發生。新的技術和創新理應在降低成本。」Ross Intelligence CTO Jimoh Ovbiagele 曾告訴機器之心。
方廣資本管理合夥人、CEO 洪天鋒
「法律服務,跟現在非常多的公共服務一樣,昔日王謝堂前燕,需要飛入尋常百姓家,怎麼飛入尋常百姓家,需要藉助 IT 這樣的工具。」洪天峰認為。
法院是法律服務的另一供給方。「我們的訴訟法是前網際網路時代制定的,不管是法學院學生還是一些老百姓,觀看法院庭審,都覺得非常複雜,非常無趣、非常枯燥、非常慢。」最高人民法院司改革辦公室規劃處處長何帆說,「隨著人工智慧的推進,訴訟法會被網際網路改寫。比如,我們可以在開庭前解決身份識別。」
「種種不滿意和差距其實就是最大機會。我們做投資,尋找機會,往往都是從差距開始。」洪天峰表示。初創公司可以將法律複雜性轉化為創造價值的機會,為個人、企業提供簡化解決方案。
目前,法律科技使用到技術包括自然語言處理、機器學習、專家系統、區塊鏈、雲端計算、視覺化、大資料分析等。算力、資料開放與爆發、深度學習技術等因素,是法律 AI 創業的根本推動力。
「人工智慧的第二個浪潮基於資料。它們可以做出各種各樣不同的預測,分析各種各樣不同文件,然後能夠分析各種不同相關資料。在合規調查中,在訴訟中,能夠幫助我們準備最準確的文件,系統還能幫我們分析各種各樣危險因素,在不同組織體系之中發現法律訴訟潛在危險因素。」英國大法官首席資訊科技顧問、 人工智慧和法律科技方面領軍學者 Richard Susskind 說。
英國大法官首席資訊科技顧問 Richard Susskind
法律 AI 應用場景的分析與預測
最新史丹佛大學 CodeX(美國第一個法學與電腦科學實驗室) 資料庫顯示,其跟蹤的全世界法律技術創業公司已達 717 家。不過 Richard Susskind 告訴我們,「就在兩年前,這樣的創新公司並不很多,現在可能超過 2 千家,數量還在增加。」有報導稱,自 2012 年以來,已有超過 280 家法律科技初創公司募集到 7.57 億美元資金。目前, 法律創業公司客戶包括消費者、法律事務所、公司法務、法院以及法學院和公共部門。
在會上,東南大學教授漆桂林向大家介紹了知識圖譜技術在法律領域中的應用。在刑事案件中,知識圖譜技術可以幫助我們從裁判文書網 2000 多萬份裁判文書中,快速提取受害人、嫌疑人,律師、法官各種資訊,形成各種模型。「比如,一位律師代理的案件中,法院分佈如何,原告、公訴人、案件型別情況如何,我們可以做一個律師推薦。」漆桂林介紹,知識圖譜技術還可用於輔助案件處理、類案推薦、(犯罪)團伙挖掘、證據鏈生成等方面。
東南大學教授漆桂林
「我們為各種專家和律師提供一個軟體平臺,幫助這些律師和專家進行線上審判、線上閱讀資訊和線上閱讀各種不同證據。」美國法律科技企業 Neota Logic 亞太區總裁 Julian Uebergang 在會上介紹說。Neota Logic 是一個綜合了專家系統與人工智慧技術(自然語言處理技術和機器學習)的推理平臺。在「決策樹」技術的支援下,它會向使用者提出問題,並且根據使用者的回答提出後續問題,一步步鎖定使用者面對的真正問題並且給出答案。思維方式和推理過程與電話諮詢律師得到的分析思路完全一致。
Neota Logic 已經幫助 6 家律所開發了 APP 和其他就基本合規問題為客戶快速提供自動答案的網路平臺,包括全美最大勞動法專業律所之一——Littler Mendelson。後來,Littler 與 Neota 聯合成立 ComplianceHR,幫助公司法務和人力資源專員做出符合本州或者聯邦就業法規的與職位相關決定。比如,一個人究竟屬於僱員還是獨立合同工。
自助合規審查,是法律 AI 一個非常重要的應用場景。除了合規審查,大會嘉賓湯森路透法律市場情報部總監 David Curle 曾分析指出,合同管理領域同樣也很成熟,適於創新和注入新技術。許多公司也在從事這方面的工作,起草、資料提取和分析,一直到基於區塊鏈的自動智慧合同系統。接下來,這會是一個湧現創新的大領域。
湯森路透法律市場情報部總監 David Curle
合同管理主要涉及風控和成本降低這些被公司法務總監置於首位的工作。自然語言處理、機器學習和其他人工智慧技術可被用於合同週期的多個環節,包括發現、分析、合規審查。Kira Systems,KM Standards 、RAVN 的認知計算平臺以及應用認知引擎(Applied Cognitive Engine,ACE)以及 Seal Software 這些公司和產品比較受關注。
據報導,英國歐華律師事務所與 Kira Systems 合作,推出了一款併購交易中檔案稽核的人工智慧工具。該軟體能夠處理標準和非標準合同和條款,包括超過 60 種格式的檔案。在此之前,Kira Systems 和四大會計師事務所之一的德勤也達成了一筆類似交易。Kira Systems 技術長胡德克曾告訴媒體,他用了整整兩年半的時間對軟體進行了改善,讓它能夠識別類似競業禁止合同條款和變更控制權這樣的概念。雖然這家公司的軟體目前已能夠飛快的挑選出相關文件,但審閱工作仍需要工作人員來完成。不過,律師需要評審合同時間仍被縮短了 20% 至 60%。
其他主要的法律 AI 應用場景還包括法律研究、電子證據開示和結果預測。
「『怎麼做』之後,我們要問為什麼。比如,很多時候我們會問法官到底基於哪些原因做出裁決,如何進行裁決。透過 AI,我們可以知道法官裁決,也可以知道原被告雙方的動議。除此之外,我們還可以抽出所有這些檔案當中最為核心的資訊,最重要的高質量資訊。」IBM Watson Legal 的聯合創始人和首席專家 Brian Kuhn 說。
IBM Waston Legal 聯合創始人、首席專家 Brian Kuhn
Ross 是法律研究應用場景下的產品。為了讓機器「閱讀理解」法律,他們使用了許多不同的自然語言和機器學習技術,比如深度神經網路、依存解析(dependency parsing)、命名實體識別等(name entity recognition),language model(比如詞嵌入)等。
輸入「過去 5 年內,在紐約,破產後學生貸款債務可以被清償嗎?」
ROSS 系統明白你想知道紐約過去 5 年的法律,將搜尋範圍限制到相關法院。接下來,深度自然語言處理技術會對問題進行分解、分析詞之間的關係、擴充套件詞含義,並應用公司的語言模型等等。所有這些均發生在幾秒之內。
之後,使用者會得到 10 個可以回答所輸入問題的相關文章段落。使用者可以點選展開檢視相關段落在原始案例文字中的前後文。系統還會顯示相關預測結果,高亮標出其認為使用者可能會需要的部分。
「這個過程類似於讓一個助手幫忙找到答案。不過,一般來說,只有高階合夥人才有可能僱得起這樣的助手。」Jimoh Ovbiagele 曾告訴機器之心。
Lexis 和 Westlaw 將自然語言處理技術用於法律研究已有 10 多年的歷史。Bloomberg BNA 也是如此。Fastcase 和 RaveLaw 也是法律研究應用場景下比較重要的法律 AI 創業公司。Ravel 主要有案件分析、裁決分析、案件視覺化搜尋 3 大功能模組。
在結果預測領域,比較重要的玩家有 Lex Machina、LexPredict、Legal Operations Company 等。Lex Machina 在打造了大型智慧財產權案例庫後,使用資料探勘和預測性分析技術,預測訴訟結果。他們甚至不考慮企業和私人機構的資料,但最終被證明同樣有效又實惠,甚至超過專家或律師服務,現已被 LexisNexis 收購。LexPredict 建模預測最高法院的判決結果,準確度堪比經驗豐富的人員。
David Curle 預測,所要解決的問題和需求規模最大的應用場景下的創業公司,最有可能在市場中勝出。比如,使用大資料集的大規模處理加工領域,各種形式的文件審查。「任何可以讓重複性勞作節約數天數小時的技術,都可能是贏家。」他曾撰文指出。
電子證據開示就屬於這一應用場景:在資訊型別是電子版的法律訴訟過程中,使用自然語言處理和機器學習技術,發現查詢資料(比如起訴,政府調查等)的過程。電子版檔案經常搭配難以在紙質版檔案中發現的後設資料,例如檔案紀錄、分享的日期和時間等,這些細節在法律訴訟過程中很重要。這些工具可以讓檢索資料工作更加迅速、便宜和前後一致。目前,比較重要的公司包括 Recommind, Equivio (被微軟收購), Content Analyst。
四大法律 AI 創業痛點:產品經理、資料、技術與研發銷售週期
大會嘉賓聯合利華法務副總監劉趙君對現有法律 AI 產品並不滿意。這些產品大多由外部機構自行研發和投資,資料和案例都是市場上可以拿到的,因此定製性不夠。
劉趙君拿前幾年製藥公司 GSK 的最大商業賄賂案件舉例稱,對這些具體案例進行深入分析後,可以形成一套針對潛在客戶同類問題的統一方案。在這種情況下,如果聯合利華及其競爭對手都需要在營銷環節中避免商業賄賂風險,作為公司律師不會願意看到一個統一化方案。
「需要為我們特製一套適合我們公司的 AI。我會要求整個團隊去分析整理聯合利華中國以往的案件,這是非常有傾向性的,因為我們的處理經驗與事務所律師、競爭對手律師的判斷是不一樣的,這時候的私人定製化會非常有效,這是我非常期待的。」劉趙君說。
百事通也遇到過類似問題。「我們和微信團隊合作,使用了微信的一些 API。這個行業目前水平就這樣,這也是為什麼當我們做到這一步以後,感覺下一步需要更高技術能力的切入,所以我們找到漆教授共同研究知識圖譜。」夏澎說。
不過,法律 AI 要滿足劉趙君這樣的客戶需求,還有很多有待突破的課題。 大會嘉賓感受最深的一點是,沒有好的專案經理。「目前為止,我們沒有遇到過任何一家公司,他們已經有非常好的專案經理來處理技術和法律兩方面的問題。」Brian Kuhn 說。「技術方搞不清楚法院需求;法院的人不知道怎麼將自己的需求告訴技術方。」何帆說。
最高人民法院司法改革辦公室規劃處處長何帆
「每到一個領域都有自己的邏輯。司法領域、法律領域也有自己的邏輯,我們要去理解它的邏輯,沒有這個邏輯,我們是很難去真正做好一個知識圖譜的。」漆桂林解釋說,「任何一個工程都是需要由需求驅動,知道這個工程用來做什麼。實現法律的智慧化,比如同案同判或者導訟機器人,我們要構建什麼圖譜,都要從這些需求出發。」
「現在,很多法院都希望開發一種裁判文書自動生成軟體,自動協助法官進行證據或者法律分析,但實際上推動得都不是非常理想,因為法官參與太少。工程師很多,但是,工程師並不知道法官的要求,不知道律師的要求。還沒有太多法律人參與進來,一個一個地攻克罪名,做一個能夠涵蓋所有法律知識的圖譜,至少還需要兩三年時間。」何帆說。
在法律領域很多資料是公開的,關鍵是如何從資料裡面找到對專家有價值的資訊。專家方法比較容易描述成規則,描述成人們可以理解的法律條文,但資料本身是黑盒子,黑盒子和白盒子在一個系統之下如何融合也是一個很大的課題。IBM 中國研究院研究總監、大資料及認知計算研究方向首席科學家蘇中曾告訴機器之心。
深度學習需要海量資料。在標註資料問題上,讓專業的人士來手動標註文件成本非常昂貴。這也是一個難題。IBM 內部有一個專案 BlueSCAN,可以幫助稽核合同,去找合同關鍵條款是否和標準條件有衝突或是存在風險的地方。在這裡,讓律師幫忙全部標註出來具體一段話是什麼意思,風險點在哪兒,基本不可能。研究人員希望在小樣本級中,透過使用者不斷使用來不斷提高系統從而解決這個問題。兩三年前,這個專案給到 IBM 全球採購部,讓部門律師使用這個系統,剛開始的時候,這個系統只能做一些簡單的處理,現在已經可以做非常複雜的比對。
另一方面,很多時候專家知識和對資料本身的洞察之間是相輔相成的,但是從技術角度來講兩個架構是不一樣的。在雲平臺上 IBM 也有一些資料,比如 IBM 收購天氣公司預報 The Weather Company 和 Twitter 合作。但是,原始資料本身不一定能夠帶來很多價值,甚至可能帶來負擔。把這些資料加工成知識,同時把知識以一種可以使用的方式,讓這個行業使用者或者專業人士可以在他們的日常工作中用到,這才是在整個環節裡最重要的一部分。
應該開放更多資料。現在,裁判文書網點選量已有 100 多億,公佈的裁判文書已達 3000 多萬,已經是世界上最大的裁判文書資料庫。何帆說,「但是,我們覺得這還不夠。下一步,一方面繼續加強裁判文書上網,同時完善裁判文書解鎖功能,讓所有大資料公司手上有足夠資源做一些研究分析。另一方面,我們也在考慮逐步開放類似於庭審影片和其他資料,只有把人員的資料和案件的資料打通,把流程的資料、資訊的資料和裁判文書的資料都打通,才能迎來一個更加開放、更有希望的未來。」
技術仍然是巨大挑戰之一。ROSS 面對的主要難題來自法律文字的複雜性,比如在美國,五年級閱讀水平可以看一些公共出版的新聞,但是,閱讀大部分法律檔案需要相當於十年級的閱讀水平。由於法律的複雜性,一般情況下,ROSS 為了回答一個問題所需要的資訊非常寬泛,需要從很多地方提取相應資訊,用自然語言來理解,這是一個挑戰。ROSS 現在所做的研究之一,就是用神經元網路加上長期記憶相關技術,快速閱讀相關法律文字,這樣系統就可以知道在閱讀這些文字的時候哪些東西應該儲存下來,哪些東西忘掉就可以。
過去幾年,法律科技垂直領域出現了許多創業公司,許多公司尚處早期階段。不過,許多公司可能熬不過 1 到 2 年就會消失,因為法律科技創業會面臨一些比較大的困難。與金融科技、教育科技相比,這個領域的市場規模多少相形見絀。研發、銷售週期也十分漫長(進而導致資金緊張)。據報導,湯森路透(擁有豐富資料)與 Watson(擁有先進技術)合作一年多的時間,才推出 Beta 版的人工智慧法律研究產品。研發技術,需要時間,人類專家,努力蒐集有用的資料組,分析內容,訓練模型並測試結果。野心越大,花費的努力越多。
何帆在 2017「法律+科技」領軍者國際峰會上勾勒出上海 206 工程的典型適用場景。「公檢法之間,所有資料辦案系統打通。一個警察破獲一個案件,想逮捕這個人時,系統會自動提示他,你有三份關鍵證據是缺失的,另外兩份證據有瑕疵。同樣, 檢察官要起訴,系統會提示他有 80% 類似案件是不起訴的。法官寫好判決書放到系統裡面,系統會自動提示,判決與本院以及上級法院近 85% 類似情況下的判決不一樣,是否堅持這麼做,法官說堅持要這樣做,於是,系統自動把判決推送給庭長。」
「第三階段是顛覆,我認為,2030 年我們會進入到這一個階段。在顛覆階段,我們會看到越來越多的人工智慧和技術來完成法律、完成我的工作,這樣的轉變會發生在所有領域,包括律所以及法律學院等等。」Richard Susskind 說,「我相信,這個科技(AI)一定會在未來變得無所不在,我也相信就像很多金融行業 CEO 或者是這些金融行業律所也將認識到,如果他們不使用 AI,損失會非常高昂。」Brian Kuhn 說。未來,每個法律組織都要有自己的資料戰略、抓取清晰和規範化資料用來解決各種任務、將資料部署到特定應用中。
2016 年 1 月,在一份題為《法律科技將如何改變法律業務》的報告中,波士頓諮詢集團(BCG)預測並描述:
為了應對科技競爭,法律和立法諮詢企業必須考慮其成本結構和服務定價。法律界人士從一開始就被迫轉向以固定價格來抵禦價格透明的初創企業。這種價格調整讓成本受到限制,越來越多的自動化法律服務被推給了第三方。為了生存,律師將需要求助於機器人,專注自己長項。未來,我們將見證一個『競爭環』,在這個被攪動的行業中,先前玩家將被迫同樣使用那些顛覆其自身的數字服務。
AI,就像美國亞太法學院研究院執行長孫遠釗談到的那口智慧鍋,也會對現有法律產生深刻影響。
「在物聯網時代,鍋都變成了智慧鍋。鍋怎麼用,鍋怎麼弄,要與爐子對上話,火候怎麼調,怎麼弄,完全可以按照資料來做。也就是說,這個鍋的功能基本上是靠裡頭的晶片和一個遙遠、陌生的某個雲端計算,以及某一家制造鍋甚至合作企業寫的軟體。有趣的是,這麼一個鍋,每三個月就要更新一下,軟體更新,也許三年以後,它突然通知你說,這個鍋,對不起,我不再支援了,必須要換。明明可以用十年的鍋,現在三年要換一個。」
這個變革早就發生了,日後將會鋪天蓋地。「未來,是授權、許可的未來。」孫遠釗說。