網路城邦
上一篇 回創作列表 下一篇  字體:
中文檢索應該也可以如同英文檢索之便利
2009/06/29 11:51:15瀏覽1773|回應0|推薦0

  中文字「峰」與「峯」同字,兩字的部件相同,只是組字的位置不同;「啟」與「啓」同字,「鵝」與「鵞」也同字,情況和前述相同;在中文檢索上面,這三組文字皆視為不同字。名詞「周年」與「週年」同義,「周知」與「週知」同義,「潮濕」與「潮溼」也同義,可是在中文檢索上面,也視為不同義。

  英文字BLOGBlogblog三者在檢索時,可視為相同,也可視為不同。如果大小寫視為相同,則三者就相同;如果大小寫視為不同,則三者就不同。要視為相同,是將單字的字母全轉為同一種大小寫,也就是按照字典的順序排列;要視為不同,則按照ASCII內碼的順序排列。

  中文檢索若要做到像英文檢索之方便,應內建「同義字對照表」。檢索時,如果同義字要視為相同,則將關鍵字的每一個字與對照表比對,若查到的話,就產生一組詞鍵,例如,欲查詢的關鍵字為「潮濕的鵝」,就可轉成「潮濕的鵝」、「潮溼的鵝」、「潮濕的鵞」和「潮溼的鵞」等四組,之後再進行資料檢索。如果同義字要視為不同,則關鍵字不用轉換,直接進行資料檢索即可。

  如果想改善中文檢索,以增進它的便利性,做法真的不難,只是建立同義字對照表這一件艱巨的工作,必需要有人去做,最好是由政府出資去建立,以提供大家使用。就我所知,目前在Windows系統上,應該還沒有中文同義字對照表;也許是我孤陋寡聞,如果網友知道有的話,麻煩通知我一聲。

( 知識學習科學百科 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=glwang&aid=3086359