![]() ![]() ![]() |
|
|
|
2008/10/31 21:29:50瀏覽649|回應0|推薦0 | |
從奇摩新聞得知,google又有一項創舉,Google Search將可以開始搜尋「掃描文件」的文字內容...... 過去,掃描文件對於電腦而言,就是被視為一整張的圖檔,其中所包含的文字(text)資料並無法被Google’s spiders搜尋出來,因此使用者往往只能找到掃描文件的檔名,卻不知其內容為何。不過,如今Google透過OCR技術,就可以把這些已被掃描成圖片型的文字(photos of word)轉換成真正的文字(text)檔案,這樣一來也就容易透過Google’s spider被搜尋出來。 其實,OCR技術已開發有一陣子,例如就有廠商透過OCR技術來掃描名片,或者是數位圖書館,透過OCR技術將書本掃描成數位檔案。不過OCR技術一直以來的問題就是,掃描後的文字準確度,因為掃描後可能與原本圖形文字不合,需要經過人工仔細校對,但隨著OCR技術不斷進步,目前精確度已相當高。而Google也如今也將OCR技術應用在網路搜尋領域,也讓使用者未來可以不只搜尋純文字,包括PDF檔案的內容,或更多影印文件等都可以透過OCR技術的辨識與轉檔,被搜尋得到。 http://tw.news.yahoo.com/article/url/d/a/081031/35/18ma3.html |
|
( 不分類|不分類 ) |