姓名雲

九十五年高中高職聯合登記分發入學 8 月 11 日放榜。我利用之前統計歷年(九十五九十四)大學考試分發入學榜單常見姓名的程式,分析了今年高中高職聯合登記分發入學高雄區榜單的 15110 個名字 。這次,我稍微修改了程式,用類似關鍵詞雲(tag cloud)的方式來顯示常見姓名的「姓名雲」。

出現頻率最高的 50 個姓氏:

出現頻率最高的 50 個名字:

于婷 子翔 玉婷 伊婷 宇軒 志偉 志豪 佳琪 佳蓉 佳慧 佳樺 佩君 佩珊 宗翰 宜庭 怡安 怡伶 怡君 怡婷 怡靜 承翰 俊賢 冠宇 冠宏 冠廷 奕安 威廷 建宏 彥廷 柏宏 柏翰 郁婷 郁雯 哲維 哲瑋 家豪 家銘 珮瑜 婉婷 景翔 智鈞 雅涵 雅婷 雅琪 雅雯 詩婷 靖雯 靜怡 琬婷 鈺婷

基本作法是,頻率取對數後,在最小值和最大值之間由低至高平均分為七個等級(類似這篇文章提到的作法)。字型屬性的部分,我操弄三個向度:大小、粗細、顏色,每個向度各有七個等級。三個向度都和頻率共變,也就是說,愈高頻的姓氏或名字,愈大、愈粗、愈亮。參數都是隨便試出來的,並未最佳化,也未必和知名網站關鍵詞雲使用的參數相同。

就像各種統計圖表一樣,關鍵詞雲只是一種呈現統計資料的方式。這個方式或許新鮮,但不神奇。許多網路服務提供者搞不清楚,以為首頁有了關鍵詞雲就是 Web 2.0 服務了。那種想法就好像在牆上插了一個亮晶晶的水龍頭,就以為會有自來水跑出來一樣,本末倒置了。

延伸閱讀:PChome 在搜什麼雲?九十五年大學考試分發入學榜單常見姓名台灣百家姓菜市場名的背後九十四年大學考試分發入學榜單常見姓名


Comments are closed.