中文《全字庫》網站的「部件查詢」之使用心得 - 王國良的部落格

字體：小中大

中文《全字庫》網站的「部件查詢」之使用心得

2009/07/31 09:26:48瀏覽7603｜回應0｜推薦13

使用Vista作業系統的個人電腦，可以查得的漢字總字數是27,484個，而全字庫網站可以查得的漢字總數是10萬字，是前者的好幾倍之多。在全字庫網站，使用者對於會念的字，用注音查詢得到的同音字會很多，不容易挑出所要查的字，通常會再搭配筆畫或部首做「複合查詢」。對於不會念的字，除了用筆畫和部首查詢之外，採用「部件查詢」是一個很好的選擇。全字庫網站部件查詢的網址是http://www.cns11643.gov.tw/AIDB/query_general.do?active=10(備註：連結需要等候一些時間)。

使用部件查詢和部首查詢與筆畫查詢一樣，都需要先計算部件的筆畫，但前者是每個部件個別計算，中者是只計算部首，而後者是把整個字的筆畫一次計算出來。用部首或筆畫查詢，得到的「待選字」會很多，但使用部件查詢，待選字會很少，甚至完美到只有一個而已。

部件查詢的部件選單雖然會列出很多長相相似的部件，可是有些字典上的部首並未納入，例如，魚字部被分解成「勹、田、灬」；鹿字部被分解成鹿「广、X、匕、匕」，X代表鹿字除去「广、匕、匕」剩餘的部件；鳥字部被分解成「Y、灬」，Y代表鳥字除去「灬」剩餘的部件；鼠字部被分解成「臼、Z」，Z代表鼠字除去「臼」剩餘的部件。

筆者認為理想的部件查詢，應朝下面幾點做改進：

(一) 部件選單應按字典的順序排列，不要跳來跳去，以方便選擇。

(二) 由於部件選單太長，當翻頁看到下面時，已不知是屬於幾畫，應利用顏色加以區分。

(三) 原先的最細小部件編碼可以維持，但字典上所有的部首皆應被納入，當使用者選擇部件「勹、田、灬、土、土」，可以查得「鮭」字；當使用者選擇部件「魚、土、土」，應會自動轉成內碼的部件「勹、田、灬、土、土」，進而查得「鮭」字。

(四) 部件輸入項應接受文字的輸入，而非一定要選擇部件，對於會念的部件，用注音輸入，會比用選擇的來得快。另外，也應允許輸入不是部件的文字，例如，「鮭」字，應允許輸入「魚、圭」，而非一定要選擇「勹、田、灬、土、土」。

(五) 相似的部件皆應等碼化，目前網站上長相相似的部件還不少，好處是讓使用者方便選取最相似的部件，但缺點是未選用最相似的部件，就會查不到所要的字，改進的方法是應內建「長相相似的部件對照表」。檢索時，如果長相相似的部件要視為相同，則將關鍵字的每一個部件與對照表比對，若查到的話，就產生一組詞鍵，例如，欲查詢的關鍵字為「亻土土」，就可轉成「亻土土」和「人土土」兩組，之後再進行資料檢索。如果長相相似的部件不想視為相同，則關鍵字不用轉換，直接進行資料檢索即可。﹝註一﹞

(六) 重新查詢時，應像注音、部首和筆畫查詢等功能，保留前一次的選用值，不要將原值清掉，以利部份修正或借用原輸入值。

全字庫網站所容納的漢字總數極為龐大，對於不會念的字，或不認識的字，利用「部件查詢」是一個極佳的方案。但目前因為部件高度細分，所選的部件形狀，如果不是最相似的，就會查不到所要的字；也不允許部份修正原先的選擇值，必須重新選擇。如果設計單位願意參考本文所提出的六點建議去做改進，則部件查詢將會變得更具使用者親和性(User-friendly)。

﹝註一﹞請參考2009年6月29日，筆者發表於「知識學習類」的「科學版」文章〈中文檢索應該也可以如同英文檢索之便利〉。

( 興趣嗜好｜電腦3C )