【宋瑛堂翻譯專欄】人工譯者的金鐘罩是什麼？-深讀10分鐘-#每天閱讀幾分鐘-OKAPI閱讀生活誌

機翻比人翻優秀的判斷標準是什麼？（圖／PIXTA圖庫）

原籍德國的柯立洋（Chris Wendt）住西雅圖近郊，有兩個十幾歲的女兒，他不希望女兒立志當譯者。

柯立洋精通英德語，曾在微軟機器翻譯部門擔任Group Program主管15年，客戶包括福斯汽車和KPMG會計師事務所，任內微軟機翻部門擴展至一百餘種語言。他表示，以當今整體翻譯市場而言，機翻字數的比例已超出人工一千倍。身為華人女婿的他明瞭，儘管女兒是雙語族，等她們走到事業巔峰期，人工翻譯只在小語種領域才吃得開。

「假如我女兒堅持走翻譯這條路，」Chris說，「我只能建議她們從事荷韓語互譯，因為這兩種語言的搭配會比中英活更久。」大語種是機器翻譯的強項（詳見：快被淘汰的譯者群），經濟文化強勢的小語種譯者終有鹹魚翻身的一天。拉長時空來看，小語種才是利多的長尾語言。

機翻的優勢在於量產，枯燥單調的資料再多，也不會翻譯到盹龜（tuh-ku）。人類譯者再強，能一天拚完密密麻麻三百頁的有幾個？能日復一日這樣操嗎？政經醫法數理工農跨學科術語一把罩的中英譯者又有多少？即使有，誰敢跟機器較車（kà-tshia）？

機器翻譯演化到神機譯（Neural MT），應用更先進的Transformer深度學習模式，搭配GPT-3自然語言生成器，雖然還稱不上人工智慧，但譯文機械味已逐漸消退，有些句子已能通過圖靈測試（Turing Test），能以假亂真，難怪業界唱衰大語種譯者，誇口機翻已能和人工相抗衡的論述也時有所聞。

Google搶先在2016年推出神經機器翻譯，業配論文裡含蓄帶過一句：已經可以媲美人工了。隔兩年，微軟跟進，這次聚焦在中翻英，論文宣稱機翻「幾乎和人工翻譯不相上下」，媒體以醒目的標題報導：「機翻已能追平人類」。到了2020年，捷克更聲稱CUBBITT機器翻譯已經比人類厲害。捷克，這真的太神奇了。

以機器翻譯為題的研究很多，位於京都的情報通信研究機構蒐集近十年的學術論文，分析後發現，採用「BLEU評分法」審核機翻品質的論文多達98.8％，只用BLEU、不找真人評比的也有74％。

BLEU全名是「雙語評鑑替代法」，靠演算法分析譯文，重點擺在「字串相似度」，迥異於肉眼判斷翻譯品質的準則。概略而言，機器能譯對一句話其中幾個字就算及格，可直譯就採直譯，有創意的正確譯法不但不加分，反而會遭倒扣。例如，原文He paid someone to take his online test，你譯成「他找槍手上網代考」，沒照雙語詞庫翻出「付錢」、「某人」、「參加」、「線上考試」，還用了「槍手」這個有雙重定義的俗稱，機器可能判你全句通通翻錯。

機器為機器當裁判有失公允，請血肉之軀來評估就客觀多了，可惜找素人評估也要看對象。評審機翻品質為了降低成本，學者通常找血汗工或微工人來判定，批發價揪來的人手文字素養高低不等，參考價值堪議。反過來說，捨得花錢的學者請專業譯者當評審，譯者明顯偏袒人工譯文，也會產生誤差值。

細查機器翻譯論文也可發現，不少學者叫機器翻譯的原文並非原文。以中翻英研究為例，測試用的中文其實是事先從英語譯成中文的文章，叫機器回譯成英文當然容易。懂雙語的資工學者未必懂翻譯，犯這種錯無可厚非，但不懂翻譯的學者寫翻譯論文，就算主題是機器翻譯，信服力恐怕也會大打折扣。神機譯是編碼解碼的程序，真人翻譯是憑情境置換語言，兩者的原理南轅北轍，技客不懂翻譯卻為機翻寫程式想必也是日常。雙語人客串當譯者，翻得磕磕絆絆的也大有人在，編碼解碼能破解箇中奧祕嗎？

譯者會不會被取代？精通中英文的小孩，到底能不能再以譯者為終身志願？文學界的看法比較樂觀。神經機器翻譯再神，可能也扳不倒藝文界的譯者。我曾以《老人與海》首句為例，一較人機翻譯的高下（詳見：對機器的傲慢與偏見），格局太綠豆芝麻，都柏林市立大學擴大規模針對文學做研究，先灌資1000本加泰隆尼亞語小說和1600本英語小說，再餵機器吃133本英加雙語小說，加以訓練，然後另外找英翻加的《麥田捕手》、《一九八四》和哈七《死神的聖物》人工譯本，請非譯者的英加雙語民眾比對機翻文發現，神機譯的品質最高只達人工水準的34％，換言之，在最佳的情況下，每三句就有兩句不堪一讀。

麥田捕手(作者沙林傑誕生100週年紀念版)

一九八四(反烏托邦三部曲全新譯本，精裝珍藏版)

哈利波特(7)死神的聖物【繁體中文版20週年紀念】

十個月後，同一組學者再針對譯後編修（post-editing）發表論文，顯示所有受測員都寧可自己從頭翻譯，因為束縛較少，能自由發揮創意。但受測員也承認，趕時間的情況下可用機翻，但不會主動擔任譯後編輯者。

機翻普及，譯後編修員日漸吃重，角色雖和譯者部分重疊，但工作內容比翻譯複雜，非用輔助翻譯軟體不可，還得協助改進機翻效能，儼然是一門新興職別。校對人工譯文時，編輯將心比心，還猜得出譯者為什麼這樣翻，改得辛苦卻也不至於傻眼。譯者漏譯的現象很常見，神機譯也會跳針跳譯，譯後編輯面對頻出怪招的機翻文，猜不透機器的邏輯，一個頭不只兩個大。此外，譯後編輯的時薪未必比得上譯者，所以徵才廣告美其名「語言專家」、「專業翻譯」才有求職者點閱，雙語人士還是樂於當譯者，繼續緊抓綠豆翻譯成四季豆的小辮子，看扁機翻。

還在嫌機器翻譯爛？容我在此為機翻辯護一句：是你用錯了好不好。

以綠豆（mung bean）為例，翻譯軟體多數直譯為green bean（四季豆），但如果你多打一個字，輸入「綠豆沙」或「綠豆芽」，譯成green bean的錯例變少。剪貼一整段介紹綠豆芽的文章或食譜後，正解mung bean再下幾城。再接再厲，原文如果是介紹綠豆的維基英文專頁，所有中譯頓時滿江綠（如下圖）。由此可見，機翻有時搞不清楚單字短語，以為中文「綠豆」泛指「綠色的豆子」，使用者應多提供一些上下文，輸入一整篇被引用頻繁的優質文章，更能敲醒它們裝滿０與１的腦袋。但在講求秒譯的現代，為了一個單字剪貼一整篇文章，太苛求使用者了吧。

輸入愈詳盡，機翻愈準確。（製表 / 宋瑛堂）

免費網翻令人詬病多年，付費使用的機翻水準絕對遠高於網翻。以業界付費使用的翻譯平台而言，主事者可教機器學習專業詞彙，排除雜訊，讓譯文品質從地下室爬升到一樓甚至二樓。機器學習的效果多強？以早期的線上翻譯來說，中藥的英譯名一塌糊塗，因為當時的機翻缺乏中英文對照的生科專業知識庫，但如今，根據俄勒岡州立大學副教授黃亮（Liang Huang）研究，只需灌四千句生科界的中英文本，英翻中的評分就能陡升25.3分，中翻英也提高13.4分，可見機翻不見得笨。

疫情爆發前夕，歐盟曾針對中小企業廣發問卷，回收近三千份，其中七成認為機器能勝任「蒐集行銷資料」、「社交媒體運用」、「瞭解網頁」，但也有多達七成中小企業認為，合約協商、簽約、化解交易糾紛仍需借重人工翻譯。最讓我好奇的是，居然有17％的中小企業已能放心把合約交給機翻處理，未來能攀升到幾成？法律界除了e-discovery程序和內部文件之外（詳見：快被淘汰的譯者群），下一個被機器鯨吞的類別是什麼？目前能讓機器完全自動化的機翻大多是次次要的內容，遇關鍵文件時，業者強調「人入」（human in the loop）的譯文生產流程，各個環節都有人力插手介入，何況前置期的訓練階段也要加載純人工譯文範本，以供程式參考，這些步驟都要譯者提筆上陣，換言之人類依然是主子，機器還得聽人類發號施令。

假如機器喧賓奪主的一天果真來臨了，人類怎麼辦？全部由機器人組裝的車子很多，大家還不是照買照開照坐，沒啥好怕的。西班牙籍譯者告訴我，國內加泰隆尼亞地區最大報La Vanguardia 已經全面機翻，多數加泰隆尼亞語閱報人已見怪不怪。覺得機械味沒啥好怕的人愈來愈多，譯文加註「機器翻譯」更能取得諒解，可是，文學譯本的讀者眼裡容不下一粒機械沙，高質影視字幕略帶機械腔會倒盡胃口。四十年後，就算神機譯本真的追平人類，就算《哈利波特》機器譯本問世，中英文翻譯真如業者預言江河日下，占的比例愈來愈小，台灣的文學譯者仍然走得下去，因為台文也是一種長尾語言，是未來文學譯者的金鐘罩，畢竟遲至五年前，也沒人逆料今天會颳起行星尺度級的韓流。而台語文化想放眼國際，就不能不靠現在立志以翻譯為終身職的台灣小孩。