在這個連開源標註數據集都沒有的領域,AI該如何落地?| 人物對話

 2018-04-01 23:01:14.0

對於法律科技領域來說,2014 年元旦是一個重要分水嶺。
 
這一天,最高人民法院《關於人民法院在互聯網公佈裁判文書的規定》生效實施。即日起, 全國四級法院的生效裁判文書, 除涉及國家祕密、個人隱私、未成年人違法犯罪等特殊情形外, 應當在生效後七日內統一上傳至中國裁判文書網。
 
「我們承建了裁判文書網的後臺。」北京法意科技有限公司常務副總經理陳浩告訴我們。據陳浩回憶,半年多時間,「大概到 2014 年下半年的時候,已經到了幾百萬量級。」
 
有了數據燃料,剩下的就是方法。

「14 年之後,好多新公司進來。至少,大家的共識是得有數據,沒有數據,那個事情做不成。」如今比較活躍的法律 AI 創業公司,比如律品科技、無訟均成立於這一年。
 
兩年後,中國裁判文書網已經成爲全球最大裁判文書公開平臺。數據顯示,截至 2016 年 8 月 16 日,中國裁判文書網公開的裁判文書超過 2000 萬篇,網站訪問量突破 20 億次。

更多公司開始試水 AI 領域。2016 年,法狗狗和深度好奇成立。一些大公司也開始嘗試新技術:華宇設立了子公司華宇元典,而國雙和上海百事通等也陸續開始探索人工智能在法律領域的可能性。
 
而作爲中國裁判文書網承建商的法意科技,算是中國最早涉足法律數據和實證分析的科技公司之一。

「我們最早源於北京大學的一個科研課題。大家當時在研究法律法規跟案例的關係。裁判文書會引用法律,那麼能不能通過案例文本找到被引用的具體法律內容?或者,通過法律條文找到對應案例?」

那還是 2001 年,陳浩正在北大讀研究生。後來,由於研究需要更完整的法規數據庫和案例數據庫支撐,北大法意成立。2003 年,公司開始做數據庫。

「那時候就是數據量少,沒有公開那麼多文書,我們也只能儘可能從各種正式渠道採集。我們一直堅持做數據庫,當時也沒有覺得最新的計算機技術對數據庫的建設和應用有多大影響。」

 現在,完全是另一番景象。
 
2015 年以來,無論 Yann LeCun、Geoff Hinton 還是 Yoshua Bengio 都開始將關注點轉移到自然語言。Yann LeCun 認爲,NLP 是深度學習接下來要解決的重要問題,Geoffrey Hinton 則認爲未來五年最令人興奮的領域將是文本和視頻理解。
 
而國內專業人士在接受我們專訪時,也曾表示,「離錢比較近、數據比較豐富、知識結構梳理得比較好的領域」比較適合 NLP 的落地。
 
「比如,法律和醫療。它們是接近同構的兩個領域,都有大量和用戶交互的專家以及規範的領域知識。類似這類有富集的文本、領域知識、交互記錄的領域,比較容易取得自然語言理解和相關任務的突破。」深度好奇 CEO 呂正東曾說。
 
然而,對於一家深耕法律數據和實證分析領域多年的傳統公司來說,除了感受到這波人工智能浪潮帶來的壓力之外(「產品要更加精緻」),同時也感受到了許多概念宣傳帶來的干擾,還發現了一些令人擔憂的現象。陳浩多次表示「法意仍然對人工智能持相對保守的態度」,也反覆強調了產品的精準度和行業生態建設等問題。
 
以下爲採訪實錄,我們做了不變更原意的編輯。

我感覺現在行業內好多團隊似乎對這個環節的重視程度不夠,就是大前提和小前提的正確性。但實際上我感覺這是最關鍵的問題。

吳恩達說人工智能是電力,會給很多行業帶來巨大變化。您怎麼看近些年法律領域的 AI 熱?
 
現在進入法律領域的資本比過去多很多,但沒辦法和醫療這樣的領域比。
 
一方面,對人的價值不同。可能有人一輩子不打官司,但是一輩子進醫院的次數就多了。另一方面,投資人的眼光也非常犀利。在人工智能技術落地的難度上,法律可能比醫療還難,因爲它涉及價值判斷。
 
醫療更多的是用感知技術解決診斷數據獲取問題。在這些數據基礎上,設定醫學模型。但在法律領域,一拳打過去,這是故意傷害還是開玩笑?有很多價值判斷在裏面。即使用 NLP 分析發現兩篇文檔特別類似,可能就多了一兩個字,但法律結論未必一樣,還有可能嚴重不同。在計算機上實現這個,難度很大。
 
我們認爲,人工智能,某種程度上來說是從幾十年前傳統的統計學發展下來的,只是現在統計方法有了新變化。有監督學習、無監督學習、半監督學習這些方法,幾十年前就有了,只是具體算法不斷演進了。
 
對應在法律領域內,學者們做研究講的更多的是實證研究,實證研究用了很多不同的統計方法。在諸如 SPSS 之類的專業統計軟件上會看到很多熟悉的機器學習算法。這些模型,有的可能早在 100 年前被研究出來了,一直沿用至今。
 
06 年講深度學習,實際上只是在感知領域效果比較好。在認知領域,沒有見到特別成熟的商業應用,至少在法律領域是這樣。
 
從國外看,不管是英美還是大陸法系,類似的產品其實都很窄,解決的是法律領域裏某一個更細分的問題,比如說破產。有個法國公司做了一個離婚模型,做完之後提供給公衆服務,大家覺得非常好,好像產業就要變天了,但實際上這就是一個針對某個具體問題的具體模型,可能有商業化包裝的成分在裏面。

解決某個點的問題,還不能直接變革龐大的法律體系。當然,不是說這麼做沒用。像 IBM Watson,被一些專業團隊用來做二次的垂直應用(比如 ROSS——微胖注),產生了一系列產品,驗證後可能是成功的。這個應該值得大家去思考學習。
 
大的方向上,大家肯定是不會存在任何異議,但在具體推進和使用上,還是要有具體的問題意識。從具體問題出發的法律智能化服務路子,可能是對的,我們也在做這方面工作。

法意做了哪些相關的 AI 產品?
 
到底什麼樣的產品屬於人工智能領域,其實不好說。
 
比如法律文書生成、合同的合規性審查、文書質量控制、法律風險分析、業務指引等,技術層次很多,不好說是不是都屬於人工智能。只能說,計算機在各種模型和算法的支持下,可以輸出很多法律服務成果。
 
08 年,我們研發了法律文書質量控制軟件(「文書糾錯系統」),對文書格式規範、表達規範比如語義邏輯、內容完整方面、上下文邏輯方面和法律依據引用等方面進行質量控制。現在,全國大概有 60% 的法院都在用這個服務。
 
比如,如果未成年人被判了 300 元罰金,這個軟件就會提示錯誤。因爲司法解釋規定,未成年人犯罪被判處的罰金不得低於 500 元。這款產品也是通過算法、知識庫支撐來實現的。光有知識庫還不夠,還要有算法庫。
 
現在,我們在研究法律文書的法律核心問題的識別。
 
如果這種複雜又專業的文書來自最高人民法院,出自水平很高的法官,整個核心法律問題的識別,召回率能達到 75%-80% 之間。也就是說,100 篇法律文書,我們能發現 70 多篇文書的核心法律爭議焦點。它的提準率,目前水平在 85% 以上。也就是說,發現 70 多個法律問題中,大概有 60 多個問題是精準的法律核心問題。

不過,面向全國法院的裁判文書後,針對類似的問題,現在的召回率大概只有 30% 多,提準率在 80% 多,提準率相對還是穩定的。
 
感覺法意的態度相對比較謹慎,對吧?

我們的態度一直比較保守。這麼多年來,我們的基本經營理念都是堅持準確率指標。
 
這些指標要到什麼水準,咱們纔會認爲結果可以接受,這種技術才能被商業化,否則就只是停留在實驗室裏的東西。我們不習慣對實驗室階段的技術做宣傳。
 
目前市面上,有些團隊在研發類案推送系統,甚至會提供傾向性結論。雖然給這種結論有點風險,但是作爲給律師提供法律諮詢服務的參考,以及法官作爲參考不會不加甄別的接受軟件提供的結果,所以,我們覺得這類產品還是很有應用價值的。
 
但是,如果把軟件提供的法律結論直接提供給老百姓,確實會有很大的風險。

這麼多年,我們也做了很多應用,我們對某些具體問題做了一些深入研究和應用,也出來一些具體結果。這些結果,得到過反覆的驗證。

 能舉個例子嗎?
 
09、10 年時,我們服務北京大學法學院白建軍教授,就最高人民法院的量刑規範化做了一個實證研究的技術支持。
 
當時,最高院出了一個量刑指導意見(試行),作爲法官量刑自由裁量權的細化指導。白老師想做個實證研究,看看全國一百多家法院試行指導意見之後量刑實踐的實際規律是什麼。
 
我們協助白老師做了分析框架模型的技術處理和數據處理。最高法院調了大概一百多家法院三年來的刑事判決書數據。就這三萬多篇文書,按照白老師給的模型,對數據進行自動化處理——把所有判決書中記載人罪單位,全部結構化地提取出來。

我們結合了一些方法,目的就是實現高精度的結構化的數據輸出。因爲這種研究,最關鍵的就是精準度的問題。雖然大家說大數據追求模糊,不追求精確,但是,我覺得在法律領域內,精確性還是不可迴避的一個問題,如果不準,這個結論不能作爲決策依據。
 
高精度地將量刑數據提取出來後,白老師以此爲基礎做了一個研究報告,提交給了最高院。最高院相關負責人還是比較認可部分結論。
 
你看,量刑就是個非常具體的法律問題,要解決的問題也很具體-----整個模型數據的高精度的提取。問題要求的精確程度不同,相對的方法和算法也會有區別。
 
所以,我們堅持對類似這樣的具體問題進行具體落地處理。然後,注重它的一些指標,主要是召回率和準確率。
 
不解決問題的刀不是好刀,還有可能是兇器是吧?我們還是希望能夠提供特定場合下的高精度的東西給大家。
 

爲了嚴格確保產品質量,還有什麼需要特別注意的因素?
 
還有一點很重要,判斷結論是 A 還是 B 的概率,是有具體的前提的,即影響或控制結論的前提(也就是三段論的大前提和小前提)的精準度。
 
這甚至是最重要的問題。但有時候可能會忽視了這個問題,都把焦點放在結論上。結論雖然很重要,但是之前支撐的環境變量和參數如果不準,結論等於沒保障。所以,要有標準庫或其他方法去驗證這些大小前提的精準度。
 
比如,沒小孩、有家暴,能不能離婚?你告訴他這種情況下,法院判離的概率是 60%。但事實上,判決離婚要考慮的因素不止這兩個。還有很多其他因素,比如是不是自由戀愛?法官會考慮其他很多因素。但是,老百姓可能不會輸入這個因素,因爲他們不懂法律。在缺少這些因素的時候去做算法,結果就會似是而非。前提部分的精準度沒有保障,後面就會出問題,甚至會得出截然相反的結論。

所以從技術實踐角度來說,每個環節的精準度都要有一個有效的控制,肯定要採取經過反覆驗證的算法。
 
至於什麼樣的驗證方法最好,沒有統一的標準。最高法院也在組織課題研究這些問題。

在這個領域內,我們把基於規則、基於統計的方法結合在一起,它的效果就非常好。我們精度準確率的輸出,基本上都是在 97% 以上。

法意有用到深度學習技術嗎?
 
我們也有用到深度學習。之前給研究機構或甲方做的研究,爲了控制垂直精準度,不會把太彈性的算法會往裏加。彈性的算法(也就是基於統計的一些算法)精準度相對是偏低,但這種偏低的算法加入到你現在算法體系裏,會提升算法的寬度。
 
比如說,臨時有定製的需求,利用現有的成熟算法,兩三天就可以訓練出一套算法。但是,這套算法的可用性會有問題。現在我們給甲方做的東西都會嚴格控制精準度。比如裁判文書網。
 
但是,我們也沒有太快拓展自己業務邊界,還是有選擇性的在做。我們的共識是,如果精準度可以達到我們預期,這個任務的風險是可控的。
 
深度學習技術主要用在哪些方面?

現在,我們對深度學習中的這些算法,會結合到知識圖譜,比如知識規則的抽取,現在用的比較多。
 
另一個是文本分類。實際上,我們把它思路轉化了一下,我們叫它文本的結構化。
 
比如做量刑模型,前提是需要高精度提取量刑情節。某個案件當中,張三犯盜竊、詐騙數罪,是盜竊了 5 萬,還是詐騙了 5 萬,需要精準提取這樣一個文檔描述中的數據結果。就這種文檔的結構化提取而言,我們用了一些深度學習算法,也結合了一些傳統的基於規則的模型做控制。通過評測,效果還不錯。
 
文本結構化方面用的比較多。但是,用在作爲所謂的規則提取,比如說未成年犯罪的罰金不得低於 500 元這種規則的提取,我們也在嘗試着採用類似的技術來解決。
 
因爲法律領域內的文檔還是具有很強的領域性、行業特徵和受控的特點,它的文本內容、結構和文本內容結構和語義後面蘊涵的信息體系,還是一個相對可控的,容易被結構化。和新聞稿相對開放的特點還是有很大的不同。
 
在這個領域內,我們把基於規則、基於統計的方法結合在一起,它的效果就非常好。我們精度準確率的輸出,基本上都是在 97% 以上。

 達到這麼一個精準率,需要多大的數據量?
 
跑取算法的基數,現在就是 3000 多萬。08 年我們做的時候,從幾十萬開始到幾百萬,也是慢慢增長,慢慢添加的過程。
 
目前公司的產品研發是基於什麼樣的思路?
 
基本上還是根據客戶的具體需求。一般是甲方提出要求,我們再結合自身技術儲備和資源儲備,看能不能做出這樣的東西來。
 
比如,我們 08 年做的文書糾錯系統,就是基於甲方的需求。當時最高法院的主管領導覺得法官在文書質量工作上投入的精力和時間太多了,希望藉助技術手段減負,比如,對一些基本問題進行質量控制。
 
正好,我們在這個領域裏也有不少基礎性工作,有技術積累,就嘗試着研發了這款產品的雛形,試用一段時間後,效果還挺好。後來我們發現,對法院裁判文書的質量管控來說,這個應用很有意義,就在滿足最高法院需求的基礎上,把它變成了一個現在全國範圍內的大部分法院都採用的產品。
 
在我們看來,面向一個真的問題,我們做 IT 的才能發揮價值。和 2C 領域不同,在電子政務領域,這個意識特別重要。電子政務有時是基於一些政策,基於行業的一些發展需要而產生,這些需求有可能今年存在,明年可能不存在,波動性比較大。
 
這對產品的迭代不利吧?
 
確實不太利於技術迭代。應該說,這是所有涉足這個領域的法律 AI 公司都會都遇到的問題。

所以反過來,我們也會跟甲方反饋這些問題,持續穩定的研發投入,技術的成熟度纔會不斷接近用戶的理想狀態,生態會更良性一些。
 
但就目前來說,還是多參與行業內的一些信息化建設。要接觸的多,你才能跟得多,也更清楚行業內建設的重點方向是什麼。

 由此看來,法意的核心技術實力也是基於 B 端具體的產品需求逐步積累起來的吧?

是的。我們持續投入,都是基於目標任務。有經濟產出也很重要,我們不是純研發。

我們最早做數據庫也是靠人整理。後來,就考慮能不能自動化,就文本里提取了一些東西,做算法來實現結構化抽取目標。因爲當時需要整理的信息項比較少(比如法規名稱、頒佈機關、效力、法規文號等),就只提了一部分,這個時候,已經有算法的思想在裏面了。
 
比如,當時做法規數據庫還要處理法規效力變化,這是一個動態變化。每天往裏面扔一百部法規,可能有一部會對歷史庫裏的幾百部法規產生影響,這裏就需要有算法實時監測這些變化關聯,包括法規之間、上位法和下位法之間、同位階法條之間的關係。我們當時就用傳統的算法來實現的。
 
03、04 年,我們做內部研發平臺,將這些經驗積累起來,也做了大量調研,想辦法讓客戶搜索更精確。

我們一直清醒地認識到,法規數據庫也好,案例數據庫也好,提供的這種查詢檢索功能,一定要比較精準。所以,算法訓練出來結果,在進行迴歸測試時,要有精度的控制。如果精度達不到,這個結果就不能用,否則會誤導使用者。
 
從 07、08 年開始,我們遇到越來越多的實證研究統計分析需求,這些需求不再侷限於過去簡單的五六個字段,有的甚至達到了 4-500 個字段。只有足夠豐富的角度去分析它,才能提供一些有價值的分析結論。
 
這些需求也成爲我們技術升級的動力。我們發現標引規模太大了,傳統的處理方式不夠用,就慢慢引入了很多基於統計的算法。在傳統的基於規則的方式,基礎上增加了一些新的統計算法,結合在一起後,我們發現效果很好。這種方式精準度有保障,整個工作效率也有保障。
 
所以,從 03 年最初做數據庫爲基礎,積累到 07,08 年,核心技術基本上比較成熟了。接下來就是基於應用不斷去積累。

策劃一款成功的法律 AI 產品的關鍵,主要還是在於用戶需求,要解決的核心任務,將產品帶入到場景中。

目前公司的數據庫產品怎麼收費?
 
我們的法規案例數據庫,全國高校每年按服務費收取,幾萬元不等。全國法學院有法學院和有法律專業的,也就是 600 來家,全部加起來一年也就一千多萬的市場規模。
 
考慮過設計面向其他用戶羣體的產品嗎?
 
這麼幾年來,我們的基本精力主要放在政法機關,高校法學教育機構。這兩個受衆羣體本身就從事法律業務和正在進行法律學習,對法律信息化需求比較剛性,也比較集中和穩定。
 
對於律師行業來說,還是要看要解決律所和律師的什麼需求。如果是滿足資源管控需求,那就是 ERP。EPR 本身是個好東西,意味着產業化、規模化和標準化。資源優化是一件好事,但恰好碰上律所這類人合組織,就很考驗合夥人的管理文化了,看他們需不需要管控。
 
所以我們後來做了一段時間以後,發現這個領域的專業化標準化和規範化,確實還有很大波動,也比較難做,就暫停了這一塊業務。
 
不過,律師領域還有一塊業務領域,用智能化軟件手段輔助律師進行業務處理。這肯定是一個可行的方向。但是,律師本身就是專業能力很強的一個羣體,如果軟件本身的智能化能力不是特別高,他們的需求也不會那麼高。
 
老百姓這塊兒市場呢?

 
至少在軟件的整個能力沒有達到一定高度時(不準、不是很靠譜)的時候,會有誤導。再說,提供法律服務的公共渠道並不少。
 
我們現在在內部預演類似產品。嘗試做了離婚,民間借貸,道路交通肇事等領域。比如,能不能解除婚姻關係,會給你一個結論。我們這個結論是基於一百多萬離婚案件的裁判,不是我們通過規則設置的。不斷增加判決書進行訓練,結論就有可能會變,但它就是基於這個文本本身。
 
不過我們也一直堅持,如果這個產品精度不是很高,我們不會把它拿出來商用。

在您看來,策劃一款成功的法律科技產品的關鍵是什麼?
 
要更多地將智能化的產品帶入到具體場景當中。
 
比如 ROSS。他們做非常垂直的領域,比如破產。用戶輸入情況,系統告訴你能不能去申請破產。將你輸的情況,帶到所有可以破產案件裏,去做一個相似。最後我們會找到相似的案例,並且找到這些案例的結論。然後,我們的結論做一個驗證和判斷,最後我們給出最終的結論。
 
裏面的算法很多,比如你要做相似性比較的算法,把相似東西找出來,只是代表了把相似的情況找出來,但是不代表這些相似情況的法律結論,是 A 還是 B 的時候,或者是有離散趨勢的時候,怎麼給受衆一個相對明確的結論?
 
你可以告訴用戶,相似情況中,有 10% 的時候不準破產,90% 的時候允許破產。但是,這個可能不是用戶想要的答案。關鍵還是,用戶需要的是一個明確的答案。
 
面向法官的產品,和麪向老百姓的產品,解決的問題確實是不一樣的。

老百姓沒有專業的法律知識,他只管自己要輸入自己想說的話,要系統給他一個終極性的結論。比如,離婚的問題。這婚能離嗎?你就告訴她能還是不能,需要採用什麼策略和手段。他們只是關心這個。

但法官不一樣。他要考量案件的全面問題,具體到某個個案時,他可能會更關心偷錄的錄音證據是不是非法證據。
 
所以,主要還是在於用戶需求,要解決的核心任務,將產品帶入到場景中。

如果法院想讓產業界的人提供好的人工智能的產品,就必須得有一套標準,有一套所謂的那種驗證。

咱們法律垂直領域的 AI 研發到底有多花錢?
 
我們的算法,從 03、04 年開始做,一直到 07、08 年出了一個版本。它是一種引擎,一系列算法,一個支撐平臺。這多年來,算法的積累一直沒有停止。我們的這套算法都是基於應用產品的目標和任務去發展。如果今天又要研發一套新產品,產品中需要增加一些文本分析與理解的維度,我們就會去擴展這個算法。
 
06、07 年研發糾錯軟件時,之前那些積累就不提了,僅人工成本,前後就投入了 800 萬左右。當時,我們是集中研發一款市場可以接受的版本,基於之前的技術積累,進行軟件升級。當時的人工成本不比現在,800 萬已經是很大一筆投入了。
 
但是,還可能出現這種情況——到最後,你的算法精度始終沒辦法達到商用水平。這時就會非常糾結了:前期投入那麼多,再投進去有可能是無底洞,而且可能還無法評估效果,怎麼辦?做出來,有時候用到什麼場景,也未必有把握。
 
算法,和傳統做軟件(寫代碼然後呈現功能),差別很大,本身就是一個很複雜的東西。

對於我們這種規模的公司來說,專注某個垂直領域,認真去做,也會有我們的收益。不過因爲各方面原因,投入確實蠻大。
 
聽說西方几個大數據庫廠商在智能檢索上,投入非常高。其中一個巨頭會請多少年執業經歷以上的律師在一座大山裏封閉式做標註,安保措施級別也非常高。而且每年都得做。看來做 NLP 也很燒錢,NLP 和做圖像識比起來,到底誰的成本投入更高?
 
自然語言理解比較高。自然語言理解這一塊,至少得做語義做標註。比如,咱們法律要做標註,普通的高中生、大專生還不行。至少得大三的學生。人工標註都不準,沒法做訓練集。所以,得有大量法律職業者給你做這個標註。
 
之前採訪過 LawGeex,他們和國內法律 AI 公司差不多,都靠自己的法律專業團隊從事數據標記和系統訓練。他們也感慨投入非常高昂。
 
單純的工程師是肯定不夠。對於對咱們法律人來說,從產品設計到最後落地,都需要有法律人全程配合。公司設立這方面的專業團隊,才能實現垂直領域的高精度應用成效。生態面前,「人人平等。」現在請一些素質比較高的人進來,人工成本還是很高的。
 
我們當初做的時候,也遇到一樣的難題。從零變成一百很容易,自己做也可以。數據量從一百變成一萬,咱們這些人幾乎就受不了這種重複性工作。從 1 萬變成 10 萬,靠人力已經有點不現實。從 10 萬變成 20 萬,30 萬就更別提了。在這個過程中,我們也會涉及到請人去標註數據,然後讓算法教算法,然後讓算法變得更聰明。
 
從 03 年開始,我們大概用了一年多的時間把法規數據庫做到接近 20 萬部,把國內能收集到的法規全部收到數據庫。全部都用計算機的算法拆解出來做,通過自動化的方式實現。用一年左右的時間做了個案例數據庫。當時就做了這麼兩個數據庫,都是純粹用計算機來做的。
 
基於人工智能技術應用到法律領域的巨大投入, 需要國家有關部門組織力量, 構建一些應用指標, 如召回率、準確率等, 使得司法公開成果在公平正義的框架下輻射到各個羣體。

除了剛纔聊到的這些,您覺得目前產業環境中還有哪些不利於法律 AI 發展的因素?
 
缺乏 Benchmark。類似於 ImageNet(圖像)、斯坦福 SQuAD(NLP)那樣的數據集。不過標註這麼大量的數據集太花錢,一般企業玩不起。
 
但我覺得檢察院、法院還是有這個條件組織這個事情的。如果法院想讓產業界的人提供好的人工智能的產品,就必須得有一套標準,有一套所謂的那種驗證。驗證也通過你的驗證的產品,法院就放心可以用。
 
其實,這種核心技術是我們企業比較深層次的資產,所以我們不會太對外去宣傳這樣的東西。我們往往宣傳效果,比如這個糾錯軟件的精準率能到 70% 到 80%。如果別的產品達不到我們這個水平,我的產品賣的貴一點,客戶也捨得買。
 
如果精準率不達標,你可以去發學術文章,但不能應用於司法實踐,因爲司法實踐可能會造成系統性的偏差。這是法律領域,不是其他什麼娛樂領域。所以,我覺得大家還是要回歸到問題的起點,還是幾個指標的問題。

說白了,整個體系的設計是基於你的軟件目標,這個軟件目標怎麼一層一層地倒推回來,最後下沉到基礎算法。


最看好哪些競爭者?
 
有法律基因的公司,懂這個行業的。如果能堅持下來,未來應該說都發展前景都比較好。包括過去從事法律信息化建設的,也算是有法律基因。
 
主要判斷標準,還是整個核心團隊的核心負責人,他要有很深的法律背景的。現在從整個 IT 行業的發展的趨勢來說,越來越黑箱化,就是說,開箱即用。我認爲未來可能很有發展前景。
 
法意科技本來就專注於法律領域,現在外部提供了更多的工具,節省了自己的研發成本,現在直接把他們最好的算法拿過來用,並結合法意自主的核心技術結合在一起,形成符合應用指標的應用產品。
 
不過行業的競爭也在加劇,這促使我們必須加快它的這種核心競爭力,加快對外圍技術能力的整合。這也是對法意最大的推動力。
 
帶着深度學習技術回國的人才呢?
 
倒不是特別看好。全球幾大的頂尖的會議, 每年都有好多論文在發表,每年的算法都在推陳出新,不同的研究者都宣稱自己在某個點上精度做了什麼突破。這些純算法的這種發展,它是停不下來的。
 
現在這個深度學習的好多平臺都越來越封裝化,你接入 API 就行。至少 17 年,像騰訊,像百度都開放了 AI 平臺,都是開放的,算法變成一個服務。
 
我提到好多其他做人工智能的技術公司,都在開放它的 AI 的平臺。開放之後,他們還會把平臺積累的一些成熟能力,封裝成服務再開發。比如說對於語音識別。這個行業格局一下子又不一樣。
 
好多做法律業務有場景的公司,就是利用 BAT 等行業內能夠提供通用能力的平臺,快速封裝,戰略合作,切入垂直領域,像用語音識別服務法院的公司就出來好幾家。
 
既然算法都能封裝成工具,大家都是一樣的,那麼核心競爭力變成了產品能力。
 
比如,用 LSTM 這種模型,它的參數是要調優的,參數怎麼設?需要有法律背景的幫忙。這樣,效果纔會出得更快。有時候,溝通後發現不大可行,就得立刻終止這樣一個方向。對素材更瞭解,才懂怎麼調會更精準。
 
說白了,整個體系的設計是基於你的軟件目標,這個軟件目標怎麼一層一層地倒推回來,最後下沉到基礎算法。
 
有時候通過分析,你會發現它只需要解決一個問題,前面那些問題都是冠以整個法律業務場景框架設計的問題,這個前端問題處理好了,深度學習的壓力就小。不同的設計方案,他對底層的深度學習算法的要求是不一樣的。

 關鍵的問題還在於產品的設計。
 
這就是我比較注重法律基因的原因。我們通過產品的設計,有時候會迴避一些這個有時候很難解決的問題,而不是糾纏於整個產品。
 
給一個深度學習的完整框架,然後你就扔你素材進來,系統給你一個答案,然後這中間你給我海量的文本大數據。我感覺,沒有問題域的一個場景,深度學習還沒有達到這樣的水平。
 
另外,這裏面還有一個很關鍵的原因。至少在法律領域,我覺得是需要我們去這個去辨別的。大數據它更注重解決相關,不注重解決因果。實際也反映了現在這種大數據技術能力,只是給你體現了數據的一個伴隨性。

比如,你發現更多的男性,概率機會就要重一點,女性要輕一點。但是,這個東西可能並不是法官要考慮的這個東西。
 
不同法系,比如大陸法系和判例法系,對 AI 技術的採用會有很大影響嗎?
 
國內的研究者沒有明顯發出這樣的一個信號。但是,我看到介紹過來的國外文章認爲,判例法系的國家,對於這種所謂的法律人工智能的認可度更高。大陸法系這樣的成文法的國家,認可度相對低。
 
我理解的是這樣的。AI,是通過特徵相似性來輸出結論。特徵相似性,是基於大量案例描述而形成的一個集合體。判例法系,就是以案例的方式描述某個法律規則。每一個案例就像一張圖片,告訴你什麼是貓,什麼是狗。
 
而成文法系中,法條一定要抽象,變成一個法律的規則,以此爲基礎進行審判,需要一個具體適用的過程。就從這個角度來說,我認爲,在計算機理解上,制定法比判例法難度大。
 
你讓計算機去理解一個抽象的法律規定,然後輸入一個具體適用的判斷,這很有難度。至少你要以文本描述實例的方式來表達一個遊戲規則(這種數據對象),才能更容易被計算機理解和控制。計算機沒辦法理解人類的抽象思維。我們有時候理解法條都難理解,更何況電腦。

文章來源:機器之心