《中文打字機》:對現代化的焦慮與渴望驅動人們重新發現與認識中文

墨磊寧的《中文打字機:機械書寫時代的漢字輸入進化史》是一本百年難得一見的傑作。我個人身為受過漢語語言學訓練的閱讀心理學家,對相關議題更為有感。本文直接分享心得。不是導讀,也不是書評。

《中文打字機:機械書寫時代的漢字輸入進化史》

中文構字規則的重新發現

綴字法(orthography)指的是文字符號拼寫成書寫單位的規則。書寫單位通常指的是詞(words),但在本書、以及大部分關於漢字的討論脈絡裡,指的是字(characters)。

找出規則,不論組字、檢索或輸入才有可能。各路人馬揚棄約定俗成的《康熙字典》包袱,從零開始系統性地分析與歸納,可以說是重新發現與認識中文。看著就很過癮。

素樸的計算語言學

漢字數量龐大,從印刷到打字,能夠掌握文字的使用頻率、甚至是多個字的共現性(cooccurrences),才能簡化硬體與流程,增進效率與效能。我自己也有一點語料庫語言學(corpus linguistics)的訓練,在我的時代,苦工當然都交給電腦了。看著前人以人工方式實現這些計算,非常感佩。

其實直到 1975 年,劉英茂、莊仲仁與王守珍製作《常用中文詞的出現次數》時,都還是純手工。他們取樣了台灣大學生常閱讀的中文書報,形成一百三十萬字的語料庫。再把語料中每個句子的每個詞單獨抄在一張卡片上,最後統計每個詞的出現頻率。

大時代的故事與文明的進程

早在一百多年前攝影技術剛被發明時,西方的科學家就已經想到用它來追蹤眼球運動,並利用眼動追蹤研究閱讀。很多閱讀與眼動的基本知識是那個年代就建立的。

身為熟悉眼動研究的閱讀心理學家,閱讀那個年代的西方文獻時最大的感慨之一就是同一時期的中國識字率極低。能閱讀的人都很少,遑論研究閱讀。或許也可解釋為何彼時中國的打字員都是男性,不像西方都是女性。重男輕女的中國,那年代識字的或許也是男性居多。

書寫系統的落差及部分弭平

在電腦普及之前的打字與電報年代,相較於拉丁字母的所鍵即所見,中文必須經過編碼、傳送與解碼(例如電報碼),是明顯的資訊落差。

百年後電腦的出現,尤其萬國碼(Unicode)成為標準,某種程度也算弭平了部分落差:世界上所有的書寫符號都對映到一個數字。落差當然還是有的。中文還是得有輸入法,不只是換個頁碼(code page)這麼簡單。

拉丁化的漢字

因為漢字乍看之繁複以及面臨的現代化挑戰,百年前的那個年代很容易被當成文明落差的代罪羔羊。所幸拉丁化的漢字最後終究沒有取代漢字,而是成為漢字第二式。

九零年代初期剛有網際網路,但 Unicode 還沒成為標準,在網上要傳遞中文還是麻煩。在美國的中國留學生就直接用拼音來書寫中文在網上聊天,我這個台灣人因為熟悉漢語拼音,也參與了一些。雖然只是很短的幾年,但也再度回到本書提到的、早年的落差。

發明與創新

發明(invention)與創新(innovation)是不同的概念。這在中文打字機的歷史上展示得很清楚。

好的發明未必會成為好的創新。創新的條件比發明嚴苛:你不只要顧到技術上的可行性,還要顧到商業上的存續性(生產與擁有的成本),能否解決真實問題、以及解決的問題創造的價值是否夠高。所以我們看到很多巧妙的發明,卻都沒有成為成功的創新。

「輸入」概念的湧現

林語堂的明快中文打字機是奇機與奇蹟。在此之前的中文打字概念都還是檢字來打或拼出字來。但林語堂把打字變成輸入。就像現代的字根輸入法,連按幾個字根之後,就是選字。

這當然不是全新的發明,而是從之前的搜尋與檢索的研究來的。但真的也要有足夠的創造力,才能跳脫舊框架,用全新的角度思考老問題,創造新解法。

從打字機到電腦

我這一輩台灣的中文使用者剛好經歷從打字機到電腦的過渡時期。我在 1983 年擁有第一台個人電腦,Apple II 相容的無敵 XT-80。還買了中文卡。但都還不是現代的標準。1989 年有了第一台 PC,也來到倚天中文的時代。

中文打字機或許從來沒有真正普及過。但百年來各種中文打字機的研究與發現,尤其「輸入」的概念,都成為中文電腦的基礎。《中文打字機》的續集、《中文電腦》剛出版。不確定中譯本何時會出版。非常期待。

延伸閱讀