獨厚心得
進入「牆後的世界」,從數位與人文接觸的縫隙中找到靈光——《中文數位探索》
作者:董福興 內容提供:臺灣商務 / 2024-12-17 瀏覽次數(311)
近半世紀不到的時間裡,我們⾯對了書寫從類比到數位的變⾰。從持筆在紙上寫字,先轉換到以鍵盤鍵入⽂字,再轉換到觸控螢幕以及更多樣的輸入⽅式。
⽂字、輸入法在這些數位系統上就像擰開⽔龍頭流出的⾃來⽔⼀般來得如此理所當然。只有很少數的⼈,會因為「字打不出來」、「亂碼」等各式各樣的問題察覺到中⽂在數位環境裡的限制,⽽敲開⽔龍頭後⾯的牆,去研究技術細節與發展的歷史。
我在這⼗幾年裡因為推動數位出版,⼀直研究中⽂排版演化與數位技術。也透過製作各式各樣的電⼦書,發現從類比轉換數位時,技術不僅限制了表現、也形塑了內容。
例如我曾製作過六零年代⼩說家馮馮的《微曦》四部曲電⼦書,以當年活字印刷的底本校對時,鉛字能夠呈現相當多的異體字,例如「囘」、「擧」等字,都可以從原稿直接反映到印刷書上,這些異體字在紙⾯上能帶給讀者更豐富的意義。不過隨著印刷技術迭代,到了照相排版受到⽂字盤字數,以及電腦排版時代⼤五碼編碼限制,⽽無法輸入、顯⽰,就不再使⽤。儘管現在透過Unicode編碼與字型⽀援⽽可以正常輸入與顯⽰,卻顯得像古籍上的罕⽤字⼀般遙遠,少有⼈刻意在輸入法中揀選這些字來使⽤了。
到了網路時代,⽂字多以捲軸的⽅式在網⾴上呈現。多數的瀏覽器預設的排版樣式為「每段落空⼀⾏」。印刷書段落間的空⾏,通常代表分節、場景轉換等,具有意義;段落間緊鄰也讓⽂氣能夠緊連著;對鉛字排印的版⾯以及紙價⼤漲的⽯油危機時期⽽⾔,這些空⾏更是奢侈與浪費。
不過我們閱讀網⾴上的⽂字數老早就超越印刷品上的⽂字,在這樣的習慣下,段落空⾏甚⾄影響到多數印刷書的排版。以空⾏區隔的段落,意義表達上更接近⼀句句的⼝語敘說。
技術與習慣轉變得太快,我們還沒能停下觀察對⽂化造成的改變,⼜跨越到下⼀個世代了。
墨磊寧的《中⽂打字機》與《中⽂數位探索》,可能是與我們關係最為密切的兩本歷史著作。他以歷史學者精湛的說故事能⼒,梳理⼗餘年來研究累積的材料,給予我們⼀個重新審視的⾓度來看待我們每天都會做的事:輸入中⽂。同時打開了廣闊的視野,指出了未來的⽅向。
談到輸入中⽂,就⼀定要談「輸入法」,對⻄⽅⽂字⽽⾔,鍵入的字⺟直接呈現在螢幕上,你感覺不到其存在。但對⽇⽂、中⽂(無論簡、繁、拼⾳、注⾳)⽽⾔,輸入法對我們如何表達有著確切的影響。
⽂字創作是「最數位化」的創作⾏為。就算有著Vocaloid合成語⾳、以及電腦動畫,但是⼤多數的⾳樂演奏與戲劇拍攝,都還是以類比的演奏、表演,配合⼤量的數位輔助進⾏。但是⼤多數的⽂字都是在鍵盤上被敲打,或者在觸控螢幕上滑點出來;還在稿紙上奮筆疾書的創作者絕對是少數。
那麼,輸入法就會透過選字排序、推薦字、關聯詞等功能,形塑了我們的表達。不僅影響⽂字,許多YouTube影片與Podcast也是預先寫好⽂本後配⾳製作出來,所以依然受到輸入法的影響;如果輸入法未來再整合ChatGPT等⽣成式AI,那影響會更為劇烈。
反過來思考,⽣成式AI透過語意庫訓練產⽣關聯,那麼輸入法是否更能記錄每個⼈輸入時的鍵入、刪除、停頓、選字、修改等進程,以理解書寫時的思考歷程呢?我也相信⼀些社交網站,早已在發表⽂章的⽂字框中做了這樣的紀錄供未來發展AI使⽤。
輸入法極為重要,實際上⽇本與中國也在持續創新,例如Google有推出⽇⽂與拼音輸入法,在⽇本有著老牌的ATOK輸入法、中國則有搜狗等多個輸入法相互競爭。智慧型⼿機的觸控螢幕甚⾄讓⽇本年輕⼈以Flick輸入(我翻譯成「滑指輸入」)取代羅⾺拼⾳;拼⾳輸入法在縮寫與預測上更是快速演化。
台灣不僅只有作業系統內建的輸入法,「⾃然輸入法」還在不停改版演進,開放原始碼的OpenVanilla等計劃也持續開發,但相較之下就顯得緩慢許多。在這AI的世代,應該受到更多的關注、持續演進,如同書中揭⽰過去⼀個世紀各⽅在中⽂輸入上前仆後繼般前進。
我曾在⼆〇⼀九世界字體⼤會(Atypi)上聽墨磊寧講述書中關於「低解析」中⽂點陣字體的內容 ,他的結論是:「技術演進得太快,我們沒能將點陣字的設計理論化。」
實際上繁體中⽂的電腦使⽤者到⼤約⼆〇⼀〇年前,螢幕上依然常⾒到Window XP系統中新細明體包含的點陣字,⽽技術的⼤腳步沒停⽌,很快地,Apple更進⼀步將⾼解析的視網膜螢幕推到所有裝置上。在能呈現印刷品質的螢幕上,我們需要的會是各種過往印刷時代的字體(如明體、楷體、⿊體、圓體)來豐富⽂字排版,還是有著超脫印刷時代的新需求?這⼜是⼀個演進得太快,我們沒能停下來思索的問題。
已故的數位⽂化學者李⼠傑曾在⼆〇〇五年⽂化研究年會中規劃「輸入非法,瀏覽不器;本⼟不化,字體不型」議程,開啟對中⽂於數位環境中各項問題的探討。轉眼廿年過去,許多問題雖然隨著有改善,但無論⽂化⾯的研究或者技術上的推動都顯得被動。例如電⼦書與網⾴的中⽂直排,是建立在⽇⽂對直排的強烈需求才⼀併完成。中⽂繁體字在漢字⽂化圈中使⽤者少,這讓我們常會退到⽇⽂與簡體字的後⾯,造成的影響不⼩。
⽂字語⾔建構了我們的⽂化,無論是當下或者未來,更無法脫離各種數位技術⽽存在;甚⾄數位技術代替我們做出了很多決定。例如教育部曾在⼆〇〇〇年前後公布「注⾳⽅⾳符號(台語注⾳)」,這套系統在注⾳的基礎上學習台語發⾳相當容易,但是難以在數位環境輸入與顯⽰ ,結果就如我們所⾒台語羅⾺拼⾳更爲普及。也因為如此,如果我們在乎⾃⼰的⽂化、語⾔與⽂字,更需要主動地對技術有所要求,數位應該帶來更豐富多樣的可能,⽽不是早年「有得⽤就好」的貧瘠。
本書書名不比照《中⽂打字機》,將"Chinese Computer"翻譯成《中⽂電腦》,⽽譯為《中⽂數位探索》。我認為⼀⽅⾯是朱邦復對「中⽂電腦」有著更明確的定義;另⼀⽅⾯,書中隨著時代與技術演化,層層指出與⽂化與思想的交互,讓這本書不僅是⼀部技術或者器物史,讀畢,彷彿有⼈在我們⾝後伸出⼿指,指出⼀個未來可能的⽅向,書名我認為翻譯得恰到好處。
對於在乎⽂字與相關數位技術的⼈⽽⾔,墨磊寧的著作可以帶來新的觀點也可以作為依靠的⽀柱;更可以透過清晰易懂的漸進說明,將讀者帶進開頭所述「牆後的世界」。甚⾄在AI熱潮中,這本書可以帶給你扎實且明晰的方向,從數位與人文接觸的縫隙中找到靈光。也希望這本書可以點燃⼀些讀者的熱情,願意以⾏動來改善我們的語⾔⽂字在數位中的處境。
作者介紹
董福興
W3C邀請專家、中文排版需求編輯。
專精數位出版與EPUB 3電子書格式。
致力處理中文排版在網頁和電子書上的問題。
延伸閱讀
回文章列表