網路城邦
上一篇 回創作列表 下一篇   字體:
簡論文字與數位化之相關問題
2010/01/27 21:55:47瀏覽112|回應0|推薦0

會想寫這方面的的東西是因為都懂,但看到各懂一面的人,做出來的東西很頭痛。

舉例來說:差不多是WIN98的時代,有人以中文缺字為論文,但說實在這問題,知道的人都知道,那是英明偉大的教育部,把編碼給微軟時有缺漏所造成。而後時代再進步一點。資訊界開始有人想要將文字電腦化後應用,應用方面像是自動出題,然後批改的系統,這裡提的系統,不是選擇或是非題,而是簡答題、填充。

但前人也許也時空背景的因素,不懂也就算了。之後的論文都很亂來,然後越弄越繁複,還用到中研院斷詞系統。實際上光比對這一項,根本不需要用到斷詞。若理解文字本來就是一種符號,而對電腦來說,它看到的也只是一種符號。那用電腦來比對這個問題上,只剩符號出現的順序需要解決,當然順序這個問題在懂程式的人來說,是小菜一盤。

比對後才是搜索,但現在的觀念是比對與搜索一體,故稱之檢索,但能做好只有GOOGLE,因為她的作法是條件式,這樣的做法已經是類似行為模式(人類行為學-->統稱心理學)。

資訊界一直想弄人工智慧,以電腦取代人力,但對文字不了解;相對的中文界卻仍多停留在最初的過去---將資料建構在資料庫上方便檢索,殊不知對資訊界這才剛開始,建立到資庫上後,可以再做資料倉儲,之後是資料探勘.......等技術。可惜中文界太過封閉,少見有人以其他方法研究中文,這之中還要扣除管理上的研究(XXX的管理心法,XXX可以是還韓非、史記),近年有瞭解到只剩孫子兵法知識地圖這本書,是用其他方法來看待中文,但仍偏管理。

( 不分類不分類 )
推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇