機翻比人翻優秀的判斷標準是什麼?(圖/PIXTA圖庫)
原籍德國的柯立洋(Chris Wendt)住西雅圖近郊,有兩個十幾歲的女兒,他不希望女兒立志當譯者。
柯立洋精通英德語,曾在微軟機器翻譯部門擔任Group Program主管15年,客戶包括福斯汽車和KPMG會計師事務所,任內微軟機翻部門擴展至一百餘種語言。他表示,以當今整體翻譯市場而言,機翻字數的比例已超出人工一千倍。身為華人女婿的他明瞭,儘管女兒是雙語族,等她們走到事業巔峰期,人工翻譯只在小語種領域才吃得開。
「假如我女兒堅持走翻譯這條路,」Chris說,「我只能建議她們從事荷韓語互譯,因為這兩種語言的搭配會比中英活更久。」大語種是機器翻譯的強項(詳見:快被淘汰的譯者群),經濟文化強勢的小語種譯者終有鹹魚翻身的一天。拉長時空來看,小語種才是利多的長尾語言。
機翻的優勢在於量產,枯燥單調的資料再多,也不會翻譯到盹龜(tuh-ku)。人類譯者再強,能一天拚完密密麻麻三百頁的有幾個?能日復一日這樣操嗎?政經醫法數理工農跨學科術語一把罩的中英譯者又有多少?即使有,誰敢跟機器較車(kà-tshia)?
機器翻譯演化到神機譯(Neural MT),應用更先進的Transformer深度學習模式,搭配GPT-3自然語言生成器,雖然還稱不上人工智慧,但譯文機械味已逐漸消退,有些句子已能通過圖靈測試(Turing Test),能以假亂真,難怪業界唱衰大語種譯者,誇口機翻已能和人工相抗衡的論述也時有所聞。
Google搶先在2016年推出神經機器翻譯,業配論文裡含蓄帶過一句:已經可以媲美人工了。隔兩年,微軟跟進,這次聚焦在中翻英,論文宣稱機翻「幾乎和人工翻譯不相上下」,媒體以醒目的標題報導:「機翻已能追平人類」。到了2020年,捷克更聲稱CUBBITT機器翻譯已經比人類厲害。捷克,這真的太神奇了。
以機器翻譯為題的研究很多,位於京都的情報通信研究機構蒐集近十年的學術論文,分析後發現,採用「BLEU評分法」審核機翻品質的論文多達98.8%,只用BLEU、不找真人評比的也有74%。
BLEU全名是「雙語評鑑替代法」,靠演算法分析譯文,重點擺在「字串相似度」,迥異於肉眼判斷翻譯品質的準則。概略而言,機器能譯對一句話其中幾個字就算及格,可直譯就採直譯,有創意的正確譯法不但不加分,反而會遭倒扣。例如,原文He paid someone to take his online test,你譯成「他找槍手上網代考」,沒照雙語詞庫翻出「付錢」、「某人」、「參加」、「線上考試」,還用了「槍手」這個有雙重定義的俗稱,機器可能判你全句通通翻錯。
機器為機器當裁判有失公允,請血肉之軀來評估就客觀多了,可惜找素人評估也要看對象。評審機翻品質為了降低成本,學者通常找血汗工或微工人來判定,批發價揪來的人手文字素養高低不等,參考價值堪議。反過來說,捨得花錢的學者請專業譯者當評審,譯者明顯偏袒人工譯文,也會產生誤差值。
細查機器翻譯論文也可發現,不少學者叫機器翻譯的原文並非原文。以中翻英研究為例,測試用的中文其實是事先從英語譯成中文的文章,叫機器回譯成英文當然容易。懂雙語的資工學者未必懂翻譯,犯這種錯無可厚非,但不懂翻譯的學者寫翻譯論文,就算主題是機器翻譯,信服力恐怕也會大打折扣。神機譯是編碼解碼的程序,真人翻譯是憑情境置換語言,兩者的原理南轅北轍,技客不懂翻譯卻為機翻寫程式想必也是日常。雙語人客串當譯者,翻得磕磕絆絆的也大有人在,編碼解碼能破解箇中奧祕嗎?
譯者會不會被取代?精通中英文的小孩,到底能不能再以譯者為終身志願?文學界的看法比較樂觀。神經機器翻譯再神,可能也扳不倒藝文界的譯者。我曾以《老人與海》首句為例,一較人機翻譯的高下(詳見:對機器的傲慢與偏見),格局太綠豆芝麻,都柏林市立大學擴大規模針對文學做研究,先灌資1000本加泰隆尼亞語小說和1600本英語小說,再餵機器吃133本英加雙語小說,加以訓練,然後另外找英翻加的《麥田捕手》、《一九八四》和哈七《死神的聖物》人工譯本,請非譯者的英加雙語民眾比對機翻文發現,神機譯的品質最高只達人工水準的34%,換言之,在最佳的情況下,每三句就有兩句不堪一讀。
十個月後,同一組學者再針對譯後編修(post-editing)發表論文,顯示所有受測員都寧可自己從頭翻譯,因為束縛較少,能自由發揮創意。但受測員也承認,趕時間的情況下可用機翻,但不會主動擔任譯後編輯者。
機翻普及,譯後編修員日漸吃重,角色雖和譯者部分重疊,但工作內容比翻譯複雜,非用輔助翻譯軟體不可,還得協助改進機翻效能,儼然是一門新興職別。校對人工譯文時,編輯將心比心,還猜得出譯者為什麼這樣翻,改得辛苦卻也不至於傻眼。譯者漏譯的現象很常見,神機譯也會跳針跳譯,譯後編輯面對頻出怪招的機翻文,猜不透機器的邏輯,一個頭不只兩個大。此外,譯後編輯的時薪未必比得上譯者,所以徵才廣告美其名「語言專家」、「專業翻譯」才有求職者點閱,雙語人士還是樂於當譯者,繼續緊抓綠豆翻譯成四季豆的小辮子,看扁機翻。
還在嫌機器翻譯爛?容我在此為機翻辯護一句:是你用錯了好不好。
以綠豆(mung bean)為例,翻譯軟體多數直譯為green bean(四季豆),但如果你多打一個字,輸入「綠豆沙」或「綠豆芽」,譯成green bean的錯例變少。剪貼一整段介紹綠豆芽的文章或食譜後,正解mung bean再下幾城。再接再厲,原文如果是介紹綠豆的維基英文專頁,所有中譯頓時滿江綠(如下圖)。由此可見,機翻有時搞不清楚單字短語,以為中文「綠豆」泛指「綠色的豆子」,使用者應多提供一些上下文,輸入一整篇被引用頻繁的優質文章,更能敲醒它們裝滿0與1的腦袋。但在講求秒譯的現代,為了一個單字剪貼一整篇文章,太苛求使用者了吧。
輸入愈詳盡,機翻愈準確。(製表 / 宋瑛堂)
免費網翻令人詬病多年,付費使用的機翻水準絕對遠高於網翻。以業界付費使用的翻譯平台而言,主事者可教機器學習專業詞彙,排除雜訊,讓譯文品質從地下室爬升到一樓甚至二樓。機器學習的效果多強?以早期的線上翻譯來說,中藥的英譯名一塌糊塗,因為當時的機翻缺乏中英文對照的生科專業知識庫,但如今,根據俄勒岡州立大學副教授黃亮(Liang Huang)研究,只需灌四千句生科界的中英文本,英翻中的評分就能陡升25.3分,中翻英也提高13.4分,可見機翻不見得笨。
疫情爆發前夕,歐盟曾針對中小企業廣發問卷,回收近三千份,其中七成認為機器能勝任「蒐集行銷資料」、「社交媒體運用」、「瞭解網頁」,但也有多達七成中小企業認為,合約協商、簽約、化解交易糾紛仍需借重人工翻譯。最讓我好奇的是,居然有17%的中小企業已能放心把合約交給機翻處理,未來能攀升到幾成?法律界除了e-discovery程序和內部文件之外(詳見:快被淘汰的譯者群),下一個被機器鯨吞的類別是什麼?目前能讓機器完全自動化的機翻大多是次次要的內容,遇關鍵文件時,業者強調「人入」(human in the loop)的譯文生產流程,各個環節都有人力插手介入,何況前置期的訓練階段也要加載純人工譯文範本,以供程式參考,這些步驟都要譯者提筆上陣,換言之人類依然是主子,機器還得聽人類發號施令。
假如機器喧賓奪主的一天果真來臨了,人類怎麼辦?全部由機器人組裝的車子很多,大家還不是照買照開照坐,沒啥好怕的。西班牙籍譯者告訴我,國內加泰隆尼亞地區最大報La Vanguardia 已經全面機翻,多數加泰隆尼亞語閱報人已見怪不怪。覺得機械味沒啥好怕的人愈來愈多,譯文加註「機器翻譯」更能取得諒解,可是,文學譯本的讀者眼裡容不下一粒機械沙,高質影視字幕略帶機械腔會倒盡胃口。四十年後,就算神機譯本真的追平人類,就算《哈利波特》機器譯本問世,中英文翻譯真如業者預言江河日下,占的比例愈來愈小,台灣的文學譯者仍然走得下去,因為台文也是一種長尾語言,是未來文學譯者的金鐘罩,畢竟遲至五年前,也沒人逆料今天會颳起行星尺度級的韓流。而台語文化想放眼國際,就不能不靠現在立志以翻譯為終身職的台灣小孩。
作者簡介
延伸閱讀
回文章列表