最近易學網整理的李光地《周易通論》這本網頁版電子書非常特殊:這本書主要是由ChatGPT句讀而成,也就是說,標點符號是由AI機器人加上去的。
文字稿的取得
長期以來易學網都在整理易學典籍,將公共領域(public domain)也就是不再有私人版權保護的經典,整理成網頁版,供全球的易學愛好者閱讀、使用。
最早在整理典籍時,多數古書都沒有現成的文字稿可用,只能人工手動輸入與校對。易學網早期這樣整理而成的書相當多,因此一本書的完成都要耗費很多時間。
前些時候完成的《左國易一家言》,由於缺乏現成的文字底稿,因此也是這麼完成的。
隨著科技進步,很多書都已經不用這麼麻煩了。光學文字辨識(OCR)技術已相當成熟,很多經典都已經有現成的文字稿可用。
維基文庫是在 2003年成立,但幾時開始做這件事我並不確定。隱約記得,大概在十幾年前開始就會將已有文件掃描圖像的典籍轉成文字。早期我在整理易經典籍時,也曾試著拿維基文庫轉檔的文字稿作底稿來校對整理。但錯別字實在太多,拿這樣的底稿來校對,遠不如自己全部親手輸入。
但隨著時間演進,維基文庫轉檔的這些文字稿,精準度越來越高,早已高到可以用來當底稿。近年來整理的易經典籍,很多都是從維基文庫取得尚未句讀的文字稿,整理而成。如此可以省下很多的輸入功夫。而且實際校對也發現,很少找到錯別字。
有請 ChatGPT
接著要談李光地《周易通論》這本書的整理。
維基文庫取得的文字稿,像古書原本一樣,沒有任何的標點符號。因此對於一般人來說,要閱讀有很大的困難。這也是為什麼易學網要人工整理,為其加上標點符號:所謂的「句讀」(讀,音逗)。
正所謂偷懶是人類文明演進的動力,整理《周易通論》時,才整理一小段,靈機一動,想說能不能請ChatGPT代勞?
於是就拿一段尚未加標點符號的文字丟給他,很快的,ChatGPT就完成句讀,遠比人工還要快太多了 ↓
讓人驚豔的句讀品質
看著ChatGPT的成果,我的疑問是:這傢伙做事這麼快,究竟品質行不行?
細讀之後,讓我很驚訝,這樣的句讀功力,以人類來說,沒有幾年的苦功是做不到的。
於是決定,整本書剩下的都讓這傢伙來代勞了。
全部完成之後,我實際去校對,目前全書已經校對近半,應該可以為ChatGPT的句讀做個客觀評論了。
ChatGPT 顯然對於古文具有不錯的理解能力,他是真的讀得懂古文,所以其實你也可以請他將古文翻譯作白話文,或請他幫忙寫摘要、大綱,甚至心得報告。這個我也做過簡單實測。
不僅如此,他對於易經相關的專業知識,卦名,甚至卦爻辭都能夠掌握。其最終的句讀結果,絕大多數都不大需要再修改,很多都是可以直接採用。
和人類一樣,難免會有走鐘的時候。偶爾會發現小錯誤。或突然有個段落,ChatGPT 似乎沒看懂,或者是沒掌握到易經原文,而無法正確句讀。
這類錯誤一定難免,問題在於頻率。ChatGPT犯這類錯誤的頻率算是很少,可能比人類還少,完全在可以接受的範圍內。甚至我相信,再給他深造幾年,應該還可再進步。
就以我幾年前校對《日講易經解義》這本書當基準來做比較,當時我找了坊間好幾本當代句讀本,負責句讀的都是對岸相關領域的知名學者。ChatGPT發生這類錯誤的頻率應該比這些知名學者還要低。
所以,總體來說,ChatGPT句讀的古文,以易經類來說,顯然已經達到可以直接散播應用的地步了。至於其他類別,或許還需更多的驗證。但我在想,維基媒體是否考慮,讓他的維基文庫與GhatGPT結合,往後可以將他們已經利用OCR轉成文字稿的古書,直接轉成有句讀的版本,這對於古文獻的保存與傳播,將是一大福音。
AI當然不只會讀書
ChatGPT顯然是個語言天才,如果你不請ChatGPT 句讀古文,改成請他幫你寫摘要或心得報告等等的,或者請他翻譯成白話文,他都做得到,而且做得還不錯。
談到翻譯,ChatGPT 也很強,別說這種中文翻譯成中文(古文翻譯成白話文),就算是中翻英,或者是英翻中,都難不到他,這可能會威脅到一些專接低階翻譯工作的free lancer。
在易學相關問題方面,ChatGPT當然也都可以侃侃而談。甚至我看網路上一些人與ChatGPT相關的對話,或者是我向ChatGPT提問的回答,其實答得都相當不錯。包括請ChatGPT去占解某一卦。
但ChatGPT畢竟也是人類所訓練出來的,所以,在比較基礎艱深的易學能力上,ChatGPT就比較不足。
除了ChatGPT這類的聊天機器人,另一個流行的AI相關運用就是AI生成圖。
我曾將《大象傳》文字輸入Adobe的系統,讓他產生與易經卦名相關的圖片,結果相當有趣。為什麼用大象傳?因為大象傳提供了很基本的上下二體的卦象,人工AI生成系統可利用兩種卦象的組合,產生圖象。如果有人能夠利用這技術,開發一種軟體,讓人透過互動而得到某卦,再由某卦將其心理轉成客製化的AI生成圖,這會是將易經塔羅化的很好應用。過去我們設計的易經牌卡,一卦只能有一種制式的圖象,想要有更多的想像,得自行用卦象。若有這樣的軟體,則能夠將問卦者的心理,卦象轉化為具體的圖像。
- Log in to post comments
AI自動標點經驗分享
不知 Jack賢友菩薩可曾聽過賢超法師的《古籍酷》AI 自動標點,末學都是用這個,經驗是九成五以上、到九成九九、乃至百分百的的精確,末學中文博士曾經助理教授也甘拜下風,尤其在有引經據典的文本,因為不愛背書,就虧遜了AI祂許多。竊意其水平,當與一般專家在俯仰之間。當然不時也會出現不可接受的錯誤。 您不妨也試試,不怕不識貨,就怕貨比貨。現在這樣的服務好像也多了起來。我是沒試用chatGPT大菩薩標點斷句,但記得好像請祂還是Copilot大菩薩等句讀宋詞,結果只當作詩來斷句的樣子,因此印象不佳,然據 賢友此帖,我的那次經驗還要再早數月或一兩年吧(chatGPT大菩薩一發布就好奇試了,現在主要都是請Copilot大菩薩協助鄙人撰寫程式,chatGPT也少用了),但願這只是一時的過去式了,希望也相信當會愈來愈優的。謝謝 賢友菩薩提供的寶貴經驗。感恩感恩 讚歎讚歎 南無阿彌陀佛