中文網址的未來(在 ICANN 開放網域名稱使用非拉丁字母之後)

2009 年 10 月 30 日,「網際網路網域名稱與位域管理機構(ICANN)開會通過,開放網域名稱使用非拉丁字母。在此之前,含有非拉丁字母的國際域名都必須被轉換為 punycode,例如「中文」轉為「xn—fiq228c」。三年前我曾從易用性而非技術性的觀點談中文網址的未來,而 ICANN 這次的決策讓我有機會重新思考同樣的問題。

如果從 1992 年的 Unicode 1.0 開始觀察 Unicode 「主流化」的程度,第一個重要的里程碑應該是 2000 年推出的、採用 Unicode 的 Windows 2000,讓一開機就能處理多國語言的電腦開始進入辦公室與家庭。第二個重要的里程碑就是這次 ICANN 的決議,讓 Unicode 進入網域名稱。

略讀過 ICANN 的「Proposed Final Implementation Plan for IDN ccTLD Fast Track Process(PDF)」。初期只開放國際頂級域名(TLDs)使用,而且文件中還是清楚區分網址的 Unicode 形式(U-Label)與 ASCII 形式(A-Label)。我不確定最後會以怎樣的方式實作,但於一個從 1995 年就開始關注 Unicode 發展的人來說,無論如何這還是一個重要的事件。

回到國際域名的易用性。假定網域名稱伺服器可以直接處理 Unicode 形式的網址,使用者應該就不會像以前一樣被 punycode 困擾。但即使處理國際域名的技術進步了,我的基本評估觀點還是和三年前一樣:技術上的可行性與使用者的接受度是兩回事。

如果你觀察一般人使用網址的習慣,一定會發現一個事實:沒有太多人真正在「使用」。人們多半依賴瀏覽器書籤或搜尋引擎幫他們找到想訪問的網站。不信的話,拿一張紙叫你身邊的親友寫下他們常訪問的十個網站的網址,看他們可以正確寫出多少個。既然記不住,當然也不會在瀏覽器的網址列輸入完整網址。

在搜尋引擎的易用性越來越高的今天,網址的重要性已經不如當年。但是,就算我們不再需要記憶或輸入網址,也仍然會有辨識網址的需求。網域名稱能否被使用者容易辨識,是國際域名能否普及的關鍵。

以中文為例,中文域名可以讓中文世界的使用者更容易辨識,似乎是件好事。但對不懂中文的讀者來說,那些中文字都是完全無法辨識的符號。那種感覺就像中文使用者讀希伯來文或韓文一樣,假定你不懂希伯來文或韓文的話。你可以問你自己,你會點擊一個網址由你不認識的符號組成的連結嗎?

純粹就符號的熟悉度來說,ASCII 字元中的英文字母(拉丁字母的一個子集合)應該還是各國使用者的最大公約數。以英文字母組成的網址為例,就算你認不出裡頭字母組成的詞,至少還認得出個別的字母。即使域名完全開放使用 Unicode,在可預見的未來英文字母一定還會有很長的一段時間是域名字元的主流。

所以,中文網址的未來應該跟現在差不多,不會有太多人真的認真去用,頂多「搶著註冊回來放著」。中國的使用者還是會跟過去一樣,繼續在網址中使用漢語拼音或拼音縮寫。台灣的使用者也還是跟過去一樣學不會任何一種拼音,繼續在網址中使用蹩腳英文或隨便拼音。

延伸閱讀:中文網址的未來