猜名字

十三年前,我剛進碩士班,台灣也剛有網際網路。因為台灣的網際網路是先從學術網路開始普及的,而在大學校園裡的網路資源分配又以研究所為優先,上網的主力族群很自然地就是研究生和研究助理。

一群苦悶的研究生與研究助理,每天在實驗室裡除了做實驗、寫程式或分析資料,就是上 BBS 聊天了。以前的人在 BBS 上挑選帳號名稱的習慣比較保守,多半都是用自己名的拼音。就以「林志玲」這個名字為例好了,有些人就用姓名拼音的縮寫,例如 lcl,有些人則是用名字的拼音,例如 chihling,也有名字縮寫姓氏全拼的,例如 cllin。當年,主流的拼音仍是 Wade-Giles,政府推動的注音第二式不流行,漢語拼音則是既不普及也不受歡迎。

我大學畢業時就已經對 Wade-Giles 拼音、漢語拼音和注音第二式都很熟悉了,看到拼音的帳號名稱都會忍不住想猜名字。可是,一個音節可以對映到幾十個字,而一個縮寫的字母更可以對映到幾百個字。再加上台灣人從小接受注音教育,基本上是拉丁字母盲,許多人常常把自己的名字拼錯。要找出拼音或縮寫最可能代表的字,其實不容易。

我那時很喜歡做一件事:一個陌生的帳號進到聊天室,如果看起來像是名字的拼音,我會在三秒鐘之內就打出一個最可能的名字。例如,看到 kunyuan 馬上就打出「昆原」,看到 chungping 馬上打出「中平」。我有很高的機率第一次就猜對,所以經常會收到感覺起來有點驚訝的悄悄話回應:「你是誰?」、「為什麼知道我的名字?」、「別鬧了!你是不是某某某?」。有時候猜太準是會被罵的,因為總有人不喜歡網路上的人知道自己的名字。

在這個猜測的過程中,有很多策略(heuristics)可以幫忙判斷各種組合的可能性。

例如,同音字的頻率,「昆」比「坤」高,「中」比「忠」或「重」高,諸如此類。又如有一些字是比較常被用於命名的,另一些字則較少出現在人名中。例如,「苑」和「願」兩個同音字,前者就比後者常出現在名字中。

還有,性別與命名用字是相關的。以 kunyuan 為例,很少女生的名字中有「ㄎㄨㄣ」這個音,所以這比較可能是男性名字。既然是男性名字,「ㄩㄢ」就不太可能是「媛」。再說 chungping 這個例子,女生的名字較少有「ㄓㄨㄥ」這個音,「ㄆㄧㄥ」是「萍」的可能性就降低了。

單一字母的縮寫比較難猜,但原則是一樣的,那就是運用命名用字的頻率判斷各種組合的可能性。例如,看到 chwang 時,我的前三個反應可能會是「王家豪」、「王志豪」、「王志宏」。這樣在三次以內猜對的機率,其實非常高。

以前就是這樣一面聊天,一面猜名字,一面找資料做各種統計的。例如,Common Chinese namesMandarin syllable frequency counts for Chinese characters。我一度還想把找出來的策略寫成程式,後來一方面沒時間,一方面覺得自己動腦比較有樂趣,就沒真的寫出來。而且,很多仰賴即時的社交互動從對方的反應之中找線索的策略,也很難寫成程式。即使如此,每年的大學聯考放榜,我還是會找來榜單,分別依姓和名作個頻率統計。

雖然已經很多年沒有時間玩聊天室了,今年的大學考試分發入學放榜後,我還是照例做了統計。統計完之後,看著這些常見姓名,想起以前的猜名字經驗,總覺得有些話想說。於是,就有了八月十一日中國時報時論廣場那篇「菜市場名的背後」。

隔天,八月十二日,中央廣播電台的「早安中國人」節目就針對這篇文章對我作了十分鐘的即時電話訪問,從錄取考生的常見名字談性別與人權。而九月號的《講義》雜誌及十一月號的《光華》雜誌,也都請我授權轉載這篇文章。一個從自己休閒活動(姓名頻率統計)的經驗中作的直觀推論寫出來的文章,竟然得到許多迴響,也是始料未及。