網路城邦
上一篇 回創作列表 下一篇  字體:
中文《全字庫》網站的「部件查詢」之使用心得
2009/07/31 09:26:48瀏覽7348|回應0|推薦13

  使用Vista作業系統的個人電腦,可以查得的漢字總字數是27,484個,而全字庫網站可以查得的漢字總數是10萬字,是前者的好幾倍之多。在全字庫網站,使用者對於會念的字,用注音查詢得到的同音字會很多,不容易挑出所要查的字,通常會再搭配筆畫或部首做「複合查詢」。對於不會念的字,除了用筆畫和部首查詢之外,採用「部件查詢」是一個很好的選擇。全字庫網站部件查詢的網址是http://www.cns11643.gov.tw/AIDB/query_general.do?active=10(備註:連結需要等候一些時間)

  使用部件查詢和部首查詢與筆畫查詢一樣,都需要先計算部件的筆畫,但前者是每個部件個別計算,中者是只計算部首,而後者是把整個字的筆畫一次計算出來。用部首或筆畫查詢,得到的「待選字」會很多,但使用部件查詢,待選字會很少,甚至完美到只有一個而已。

  部件查詢的部件選單雖然會列出很多長相相似的部件,可是有些字典上的部首並未納入,例如,魚字部被分解成「勹、田、灬」;鹿字部被分解成鹿「广、X、匕、匕」,X代表鹿字除去「广、匕、匕」剩餘的部件;鳥字部被分解成「Y、灬」,Y代表鳥字除去「灬」剩餘的部件;鼠字部被分解成「臼、Z」,Z代表鼠字除去「臼」剩餘的部件。

  筆者認為理想的部件查詢,應朝下面幾點做改進:

() 部件選單應按字典的順序排列,不要跳來跳去,以方便選擇。

() 由於部件選單太長,當翻頁看到下面時,已不知是屬於幾畫,應利用顏色加以區分。

() 原先的最細小部件編碼可以維持,但字典上所有的部首皆應被納入,當使用者選擇部件「勹、田、灬、土、土」,可以查得「鮭」字;當使用者選擇部件「魚、土、土」,應會自動轉成內碼的部件勹、田、灬、土、土」,進而查得「鮭」字。

() 部件輸入項應接受文字的輸入,而非一定要選擇部件,對於會念的部件,用注音輸入,會比用選擇的來得快。另外,也應允許輸入不是部件的文字,例如,「鮭」字,應允許輸入「魚、圭」,而非一定要選擇「勹、田、灬、土、土」。

() 相似的部件皆應等碼化,目前網站上長相相似的部件還不少,好處是讓使用者方便選取最相似的部件,但缺點是未選用最相似的部件,就會查不到所要的字,改進的方法是應內建「長相相似的部件對照表」。檢索時,如果長相相似的部件要視為相同,則將關鍵字的每一個部件與對照表比對,若查到的話,就產生一組詞鍵,例如,欲查詢的關鍵字為「土土」,就可轉成「土土」和「人土土」兩組,之後再進行資料檢索。如果長相相似的部件不想視為相同,則關鍵字不用轉換,直接進行資料檢索即可。﹝註一﹞

() 重新查詢時,應像注音、部首和筆畫查詢等功能,保留前一次的選用值,不要將原值清掉,以利部份修正或借用原輸入值。

  全字庫網站所容納的漢字總數極為龐大,對於不會念的字,或不認識的字,利用「部件查詢」是一個極佳的方案。但目前因為部件高度細分,所選的部件形狀,如果不是最相似的,就會查不到所要的字;也不允許部份修正原先的選擇值,必須重新選擇。如果設計單位願意參考本文所提出的六點建議去做改進,則部件查詢將會變得更具使用者親和性(User-friendly)。

﹝註一﹞請參考2009年6月29日,筆者發表於「知識學習類」的「科學版」文章〈中文檢索應該也可以如同英文檢索之便利 〉。
( 興趣嗜好電腦3C )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=glwang&aid=3182553