網路城邦
上一篇 回創作列表 下一篇  字體:
《韋氏字典》很容易就造新字,中文電腦可以嗎?
2009/07/23 10:46:38瀏覽2396|回應0|推薦10

  前不久,報載《韋氏字典》一口氣新增一千多個新字,閱報之後,筆者在想,漢字也可以這麼大規模地造新字嗎?答案是否定的。不要說造一千多個新字不行,即使只造一個新字,也會產生很多問題。

  造新字離不開電腦的編碼、處理與使用,英文與中文在電腦上的編碼差異甚大。 英文屬於拼音文字,編碼空間只需要26大寫字母與26個小寫字母,而中文屬於圖形文字,一個字需要一個編碼空間,目前漢字的字數接近十萬個。

  ASCII(American Standard Code for Information Interchange,美國標準資訊交換碼)的內碼是一個位元組(Byte),編碼空間是2^8=256個,要將52個大小寫英文字母納入,自是足足有餘。

  BIG5的內碼是兩個位元組,編碼空間是2^16=65,536個。因內含控制碼的關係,並非連續編碼,它的常用字集第一個字是「一」,內碼是A440,最後一個字是「籲」,內碼是C67E,編碼空間共8,766個,但實際只用了5,401個。次常用字集第一個字是「〤」,內碼是C940,最後一個字是「龘」,內碼是F9D5,編碼空間共12,437個,但實際只用了7,652個。也就是說,BIG5的編碼總空間雖然是21,204個,但容納的中文字數只有13,053個。

  至於Unicode,內碼也是兩個位元組,編碼空間一樣是2^16=65,536個,採連續編碼,標準字集共有20,902字,Vista作業系統又提供共有6,582字的增補字集,兩者共計27,484字。

由於漢字的字數接近十萬個,故兩個位元組的65,536編碼空間絕對無法容納得下。目前未被Vista收納的漢字高達六、七萬字,若想再造出新的漢字,只能個人造在自己的電腦上,自己一個人使用,不像英文造新字,只要在字典做增加那麼簡單。

未來,如果微軟新一代的作業系統,能為中文提供三個位元組的編碼,編碼空間是2^24=16,777,216個。屆時,漢字大約只需要10多萬個編碼空間,只要是大家認可的漢字,都可容納進去。

至於後續若需要造新字,應委由微軟公司統一造字,提供使用者下載更新(Download & Update)。如此一來,使用者不需要再像過去,自己造字,而別人卻無法使用。只要是大家認可的新字,等微軟公司統一造字之後,大家皆可方便地使用,希望這個美麗新境界,能早日到來。

( 興趣嗜好電腦3C )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=glwang&aid=3159227