司法院資訊處處長賴武志 (攝影/洪政偉)

開庭中,檢辯方激烈的交叉詰問,發言字句忠實呈現於法庭螢幕。「請提示偵卷,第3頁。」審判長令下,文件應聲開啟,顯示在螢幕上的逐字稿旁。國民法官進入評議室,評議嫌犯是否有罪,碰到疑慮,國民法官開口詢問系統,相關法條隨即陳列出來。有罪,刑度如何衡量?系統分析同類罪行判決資料,給出常見量刑範圍。判決下來,法官將結果輸入系統,裁判書草稿便自動產生。這個法庭景象,最快在今年年底前就可能見到,且部分技術已經投入實務。

每個環節,都是用司法院專門開發的AI技術,把累積多年的司法智慧結晶提取成簡單易懂的資訊。司法院資訊處處長賴武志說,「如果第1次司法院IT變革是為了無紙化,第2次就是引進AI應用,將科技法庭進一步發展為智慧法庭。」

賴武志就是這些AI應用背後的推手。他同時具有司法、資訊、統計3種專業,有資訊技師、工業工程技師、統計人員、律師、司法人員多種資格,熟稔司法實務、資訊工程,以及發展AI不可或缺的數據科學。上任以來,他先推動老舊軟硬體翻新,再落實資料向上集中政策,並設置AI專職團隊,推動多項智慧法庭AI應用,以期加速案件審理效率。

針對司法業務需求發展專用AI模型及應用

賴武志直言:「司法流程會用到許多領域專門知識和用詞,以ChatGPT等通用型AI為基礎來打造司法AI應用,目前還不太可行。」因此資訊處和合作廠商根據實務場景及所需知識,自行打造出了適用於臺灣司法場景的AI應用。

眾多AI應用中,賴武志認為最重要的是法庭語音辨識。他說,法庭開庭節奏時常會因書記官打字速度來不及紀錄發言內容,發言人陳述被迫打斷。尤其涉及多人的訴訟,發言內容更多,辨別不斷切換的發言者也成為一大挑戰。所以,司法院第一個AI應用就是語音辨識系統,2019年開始發展,2020年完成開發進入試辦。

這套語音辨識系統,不僅能化發言為文字,還能自動斷句,加入標點符號,並自動刪除冗字。發展至今,法庭現場的中文平均辨識率已經達到92.7%,供法官在自己工作環境使用的離線版也可以達到90%左右的辨識率。今年,還計畫加入臺語辨識能力,以期減輕更多書記官手動紀錄工作。不過,賴武志坦言,在辨別臺語和口音較重的中文時,語辨系統準確率會略為下降。

由於語音辨識準確率並非100%,因此書記官還是需要稍微修正原始逐字稿的錯別字。為了提升辨識率,在開庭前,還可以預先上傳預學習檔到系統中,訓練一個語意小模型,來補充原本的主模型未收錄或不熟悉的單字。預學習檔會包括案件涉及的人名、公司名、案件相關的專有名詞或法律名詞等。

法庭語音辨識系統還能辨別出不同發言者,不過不是利用AI來分辨聲紋差異,而是利用輸入裝置來辨別。法庭內不同座位上的麥克風有標註身分標籤,例如證人、被告1號、國民法官1號等。系統接收音訊來源時,就能根據這些麥克風標籤來顯示對應發言者。

目前支援語音辨識的法庭有28間,預計3年內完成150間法庭語辨系統建置。

不只這一項,司法AI應用還有法庭電子卷證提示、電子卷證自動產生書籤及遮隱、過往量刑分析,以及AI客服等。這些應用,大多以司法院用司法資料去訓練的模型為基礎來展開,像是自動化標註出詢問問題、裁判書、筆錄及法條等文字內容的語意標籤,再依據需求提取或遮蔽資料。

以卷證自動遮隱系統為例,如果訴訟當事人或律師向法院申請取得電子卷證,法院需要遮隱電子卷證中的個資、商業機密及其他敏感資訊,才能交給申請人。有了自動遮隱系統,法院人員便不用逐項手動處理,只需檢查系統處理後的文件。

AI客服則是司法院第1個對外的人工智慧應用。過往,司法院AI客服主要是以關鍵字和Ruled-based的模式,讀取民眾需求,來進行簡單問答,或是提供民眾所需法律書狀格式。

後來,運用自然語言處理模型強化後,這個AI客服開始更像是聊天機器人,可以處理口語對話。甚至,還可以記憶過往對話內容,在回答民眾問題時不僅考慮問題內容本身,還能納入過往對話情境,來提供更符合對話脈絡的解答。「連ChatGPT都是最近才開始開放這個記憶功能。」賴武志自豪的說。

未來,司法院還要利用聲音辨識AI,讓電子卷證提示系統、法條檢索系統,跟客服系統,都能用聲音來控制。

另一項計畫推出的進階應用是AI自動生成裁判書工具,能自動填入犯罪事實、判決理由等,生成裁判書草稿,來協助法官製作裁判書。初期可支援酒駕、幫助詐欺、毒品案件三種犯罪類型,預計年底能推出。

司法院AI應用涵蓋審理前的線上客服、開庭間的卷證提示及筆錄生成、一路到判決後的裁判書生成。這些建置幾乎都在最近3年半內完成,不過,他坦言,這些建置,一路走來並非易事。

司法院資訊處處長賴武志表示,如果第1次司法院IT變革是為了無紙化,第2次就是引進AI應用,將科技法庭進一步發展為智慧法庭。攝影/洪政偉

強化司法院基礎建設,再建立資料蒐集機制

基於政策和業務需求,賴武志並非一上任即開始發展AI,而是強化司法院IT基礎建設,發展IT現代化。

司法院從2018年開始執行最新一期的數位發展政策,涵蓋了硬體、軟體、資安及智慧法庭建設等4大方向。隔年賴武志上任時,這項計畫正處於執行初期,他到職的同一日,也是審判系統20年以來最大改版的正式上線日。配合審判系統改版,他決定優先推動軟硬體和資安升級。

第3代審判系統是司法體系處理許多文書和司法流程的系統,由於推出時間距離前代太久,發生了新舊版本銜接困難、使用者不適應,而且有些司法機關的硬體難以負荷軟體。面對這些問題,賴武志走訪全國各法院,聽取使用者意見來作為改善審判系統參考,同時也對使用者進行教育訓練。

審判系統改善內容包括,強化文書編輯器等常用功能的使用者體驗、系統資訊安全,以及橫向系統連結,也就是串接審判系統以外的其他法院常用系統,讓使用者不必跳轉到其他程式。

另一方面,他也持續執行5年計畫中的硬體更新方針,編列硬體更新預算,逐年汰換電腦設備,並強化網路環境。尤其疫情為了視訊開庭,大幅提升了網路建設和硬體設備規格。基礎軟硬體設備現代化後,司法院今年起要開始建置南部新機房,跟北部機房互為備援,進一步提升服務穩定度,來支援IT系統向上集中,以及下一階段的法院資料向上集中策略。

由於每一個法院各有獨立的資料庫,雖然資料結構相同,但中央要蒐集資料時仍需花2至3天,來彙整各法院的資料。為了因應業務需求或開發AI應用,去年年底開始,司法院逐步推動資料向上集中,將分散於各處的資料整合進司法院資訊處,利用大數據平臺來管理、探勘、應用。

第一階段,是蒐集多達上千萬份的各法院審判系統資料。這些資料格式接近於半結構化資料,可以用來分析、探勘,更能用於訓練開庭語音辨識、裁判書草稿生成等AI模型。下一階段,要集中歸檔電子卷證,搭配OCR和NLP來提取各式非結構化資料的語意標籤,來進一步豐富AI訓練資料。

發展AI應用挑戰多,專業人才不足、使用者接受度都是課題

雖然一開始的任務是翻新IT基礎建設,不過,上任一年後,賴武志決定調整資訊處的組織架構,新增2個專責小組,分別發展自動化及AI應用。其中特別有3個專責人力負責AI,但這樣的人力規模不足以開發所有AI應用,所以,賴武志的策略是,指派這個團隊,專門研究應用可能、管理開發專案,以及擔任司法業務相關人士和外部開發廠商間的溝通橋樑。像是訂定AI應用的驗收標準就是一大挑戰,傳統資訊系統招標,很容易訂定明確的驗收標準,但AI應用不然,需要廠商和使用者不斷溝通可接受的標準。

就法庭語音辨識系統來說,若語音辨識準確率太低,書記官要手動校正太多錯字,就會影響使用意願;若要求太高,廠商又不願承擔違約風險,因而影響投標意願。再加上,司法類AI應用只有司法機關採用,沒有前例可參照,因此,雙方花了許多時間溝通驗收標準。最後,雖然理想中準確率要超過95%,在實驗室中也確實能達成,不過,驗收標準是採用法庭現場辨識率88%為基礎,逐年上調。

不只打造創新應用是難題,說服使用者採用也是另一個重大挑戰。許多法院人員習慣傳統工作方法,使用智慧法庭新建置的意願相當低,甚至往往因為不熟悉操作方法而卻步。幸運的是,趁著國民法官制度的設立,帶來審理流程轉變,例如起訴卷證不併送和集中審理等模式,更凸顯了語音辨識等AI應用的重要性,因此,司法院選擇國民法官法庭成為新審理科技展示和實驗舞臺,有望加速新科技推廣。

賴武志說,資訊處無權強制任何人使用新科技,但他們會嘗試用資訊技術來減輕使用者的負擔,盡量縮短新舊交替的陣痛期。例如,資訊處開發了一套新的練習工具,讓書記官練習為自動生成的逐字稿改錯字,而非傳統聽打訓練。

今年司法院要訂定下一個5年的數位發展政策。過往這個政策多為資訊處所草擬,不過這次,中研院研究員在研討會上和立法院在預算審查時,都對新的數位政策表達關注,希望能致力於訴訟程序的數位轉型,立法院甚至通過主決議,要求司法院提交制定數位政策過程的相關會議記錄或報告。

賴武志表示,司法院資訊處會持續推動智慧法庭及各式司法程序數位化措施,不過未來有了更多方的關注及助力,不論是立法院配合數位政策制定相關法規,還是更多具法律領域知識的專業人士提供意見,甚至只是增加對數位政策的關注度,都有望讓臺灣司法在數位轉型的路上,跨出更大一步。

 CIO小檔案 

賴武志 司法院資訊處處長

學歷:東吳大學巨量資料管理學院碩士

經歷:曾任行政院主計總處專員、科員,後至臺北地方法院擔任法官及庭長。2019年,調至司法院資訊處處長,推動第3代審判系統優化、軟硬體及資安強化、備援機房建置、大數據平臺應用,並設立專職團隊,研究並管理各式司法AI應用專案的開發

 機關檔案 

司法院

攝影/洪政偉

地址:臺北市中正區重慶南路一段124號

主要業務:為國家最高司法機關,設大法官審理解釋憲法與統一解釋法令、總統副總統彈劾及政黨違憲解散案件;另掌理與民事、刑事、行政訴訟審判與公務員懲戒等有關之行政事項。

員工數:507人

機關首長:許宗力

 資訊部門檔案 

資訊部門名稱:資訊處

直屬主管:司法院秘書長林輝煌

資訊部門人數:約30餘人

每年IT預算:約6億元

 IT大事記 

2016年:民事訴訟線上起訴系統正式上線啟用

2018年:建置本院及法務部所屬機關間電子卷證網路交換檔案機制

2019年:法院第三代審判系統正式上線

2021年:司法院官網「智慧客服小幫手」試營運

2022年:智慧財產案件開放線上遞狀、收狀

2020年:疫情期間開始建設遠距視訊法庭、建置國民法官法庭中文語音辨識系統

2023年:預計審判書自動生成系統年底上線、開始規畫備援機房建置

熱門新聞

Advertisement