字體:小 中 大 | |
|
|
2013/06/07 06:18:15瀏覽13288|回應12|推薦58 | |
前些日子,看到一則電視新聞報導,有些智慧型手機會缺「堃、煊、喆、珉、羣」等字,造成使用上的不便。為何手機會缺這些字呢?不知您的手機能否輸入這些字?本文想探討這些字在電腦上使用的相關問題。 (一) 《國語辭典》網站只能查正體字 教育部的《國語辭典》收納的字只有一萬多個,而且以「正體字」為主,因此對於像「堃、煊、喆、珉、羣」等非屬正體字的漢字,就會查不到。雖然該辭典的首頁標示可勾選「含異體字」,可是即使勾選,一樣是查不到;但如果您參考由筆者所撰的〈在《重編國語辭典修訂本》網站查詢異體字〉,就可以用變通的方法查得到。 (二) 《異體字字典》網站可查異體字 教育部的《異體字字典》可以查得到「堃、煊、喆、珉、羣」等字,它們都屬於「異體字」,詳情如下: (1) 「堃」字是「坤」字的第5個異體字。 (2) 「煊」字是「煖」字的第3個異體字。 (3) 「喆」字是「哲」字的第3個異體字。 (4) 「珉」字是「玟」字的第2個異體字。 (5) 「羣」字是「群」字的第6個異體字。 (三) BIG-5的擴充字集查得到異體字 BIG-5的「標準字集」只能查到「坤、煖、哲、玟、群」等正體字,查不到「堃、煊、喆、珉、羣」等異體字,但是BIG-5的「擴充字集」就可以查得到異體字,編碼對照如下: (1) 坤:BIG-5:A95B╱堃:BIG-5E: (2) 煖:BIG-5:B7DC╱煊:BIG-5E:9B50。 (3) 哲:BIG-5:ADF5╱喆:BIG-5E:9851。 (4) 玟:BIG-5:AAB3╱珉:BIG-5E: (5) 群:BIG-5:B873╱羣:BIG-5E:9BBE。 BIG-5的編碼是採「先筆畫後部首」,以上各字的編碼,正體字是以英文字母A或B開頭,異體字則以數字9開頭,BIG-5E的"E"代表擴充(Extensible)。 (四) Unicode的字集查得到異體字 在Unicode的字集裡,正體字「坤、煖、哲、玟、群」和異體字「堃、煊、喆、珉、羣」 都可以查得到,編碼對照如下: (1) 坤:5764╱堃:5803。 (2) 煖:7156╱煊: (3) 哲: (4) 玟: (5) 群:7FA4╱羣:7FA3。 Unicode的編碼是採「先部首後筆畫」,以上各字的編碼,異體字距離正體字都很近。 (五) 微軟注音選字列的差異 微軟注音的選字列是按「字頻的高低」設計的,各字選字的列數("-"號之前)與字序("-"號之後)對照如下: (1) 坤:1-3╱堃:2-6。 (2) 煖:3-2╱煊:4-8。 (3) 哲:1-2╱喆:3-7。 (4) 玟:1-3╱珉:3-1。 (5) 群:1-1╱羣:1-5。 由選字列的編排可知,正體字位在前面,異體字位在後面,除了同音字少的「群」與「羣」位在同一列之外,其它各組的正體字與異體字皆位在不同列。 「堃、煊、喆、珉、羣」等字皆是「異體字」,BIG-5標準字集未編碼,而BIG-5的擴充字集和Unicode字集則有編碼,如果手機的中文只提供BIG-5字集,就會缺這些異體字。中文字集若不提供異體字,則前行政院長「游錫堃」只能輸入成「游錫坤」,現任監察院長「王建煊」只能輸入成「王建煖」,藝人「陶喆」和「黃雅珉」只能分別輸入成「陶哲」和「黃雅玟」,您說這樣是不是很奇怪呢? [參考資料] (1) 教育部《重編國語辭典修訂本》(簡稱為《國語辭典》) (2) 教育部《異體字字典》網站 (3) 《全字庫》網站
|
|
( 知識學習|語言 ) |