姓名雲

九十五年高中高職聯合登記分發入學 8 月 11 日放榜。我利用之前統計歷年(九十五九十四)大學考試分發入學榜單常見姓名的程式,分析了今年高中高職聯合登記分發入學高雄區榜單的 15110 個名字 。這次,我稍微修改了程式,用類似關鍵詞雲(tag cloud)的方式來顯示常見姓名的「姓名雲」。

出現頻率最高的 50 個姓氏:

出現頻率最高的 50 個名字:

于婷子翔玉婷伊婷宇軒志偉志豪佳琪佳蓉佳慧佳樺佩君佩珊宗翰宜庭怡安怡伶怡君怡婷怡靜承翰俊賢冠宇冠宏冠廷奕安威廷建宏彥廷柏宏柏翰郁婷郁雯哲維哲瑋家豪家銘珮瑜婉婷景翔智鈞雅涵雅婷雅琪雅雯詩婷靖雯靜怡琬婷鈺婷

基本作法是,頻率取對數後,在最小值和最大值之間由低至高平均分為七個等級(類似這篇文章提到的作法)。字型屬性的部分,我操弄三個向度:大小、粗細、顏色,每個向度各有七個等級。三個向度都和頻率共變,也就是說,愈高頻的姓氏或名字,愈大、愈粗、愈亮。參數都是隨便試出來的,並未最佳化,也未必和知名網站關鍵詞雲使用的參數相同。

就像各種統計圖表一樣,關鍵詞雲只是一種呈現統計資料的方式。這個方式或許新鮮,但不神奇。許多網路服務提供者搞不清楚,以為首頁有了關鍵詞雲就是 Web 2.0 服務了。那種想法就好像在牆上插了一個亮晶晶的水龍頭,就以為會有自來水跑出來一樣,本末倒置了。

延伸閱讀:PChome 在搜什麼雲?九十五年大學考試分發入學榜單常見姓名台灣百家姓菜市場名的背後九十四年大學考試分發入學榜單常見姓名

隨機文章:TVBS 新聞歧視外籍配偶推廣開放原始碼軟體:一些個人經驗電腦網路上的物質與心靈網路用途 不可貿然設限OpenOffice.org 簡報範本(三)