網路城邦

上一篇 回創作列表 下一篇   字體:
電腦翻譯的過去與前瞻
2013/07/07 16:44:07瀏覽2155|回應0|推薦2




翻譯語言一直是電腦專家多年的夢,早在1954年電腦使用真空管的時代,電腦體積有整個房間那麼大(當然速度差多了),已有許多先驅專家嘗試用電腦翻譯語言,起步之際利用IBM 701打卡式電腦,儲存250組雙語詞彙配對,僅以6條文法規則,藉其翻譯了60個俄文短句,當時IBM還發表慶賀新聞稿,聲稱其翻譯流暢,還認為前景頗樂觀,當時計劃主持人是喬治城大學的多思特(Leo Dostert)教授,他還預測,三到五年內,機器翻譯就會成為既成的事實。但最後證明,當初的成功其實是誤會一場,充其量電腦只是對應字詞或抓回記憶,絕不是真正的翻譯,到了1966年,那群機器翻譯的先進,終於宣告失敗,他們沒料到問題遠比想像中更困難。而要教電腦如何翻譯,教的不只是規則,還得教例外。翻譯不只是記憶和回憶,還要視上下文(context)而做不同的選擇。遇到慣用語(idiom)更是束手無策。我一直不明白,慣用語資料庫為何不能解決像“What’s in it for me? ”這樣的翻譯?如果輸入慣用語詞典,還是解決不了問題嗎?

使用過翻譯軟體的人一定有經驗,有時譯文超級離譜,選字完全脫離情境,譯文也完全不符常理,修改不如重譯,更要緊的是,你完全無法掌握其正確的部分在哪兒,不知哪家翻譯軟體是值得信賴的?
有些慣用語其實也蠻固定的型態,像 Out of sight, out of mind. (日久情疏。)In for a penny in for a pound. (一不做二不休)人腦在翻譯上的運作當然不是只有記憶與回憶,當你譯完 Time flies like an arrow. (光陰似箭)來上另一句,Fruit flies like a banana. 你鐵定不會譯成“水果飛得像香蕉“ 也不會譯成” 果蠅像香蕉“ 因為like這會已用作動詞,而不是介系詞,所以譯成“ 果蠅喜歡香蕉” 才合理。這樣的轉折,人腦一瞬間,電腦要做多少運算?

過去我一直想念完24冊的Spoken American English,可是挺困難的,又不是只看過就完事,還要隨時從腦中取用才行,對電腦而言是小事一樁,人腦則深覺重負,電腦運算速度快如閃電,記憶快又紮實,可是翻譯卻沒那麼輕鬆,何也?人與機器合作的話結果又會如何?這段路有人走過一陣子了吧?不知是否仍難行?

最近同時讀本質上挺矛盾的兩本書。牛津大學網路研究所教授
VIKTOR MAYER-SCHONBERGER 與 KENNETH GUKIER 合著的“Big Data"(大數據,天下出版)及 哈佛大學商學院教授
 Eric Siegel 的“Predictive Analytics---the power to predict who will click,buy,lie,or die),方法論上已是兩條不同的路,但因為都想詮釋真實世界的真面目,讀起來挺有趣的。 似乎連Coogle 與 Amazon 都採用 Big Data 的概念,風起雲湧,能否蔚為成風,但看發展; 嚴謹的研究思緒在資料更豐富,電腦運算更迅速下,也可能改頭換面,讓我們拭目以待。科學其實在講究嚴謹下也走到預測不準的死胡同,大資料開拓了嶄新的另一條路,只是會帶領我們到哪裡,誰也不敢論斷。提這兩本書是因為他們都談到Big Data 的觀念。有位書評家還稱 Eric Siegel 的“Predictive Analytics“ 為“ Freaknomics of Big Data.” 當然不是純立場的對立,而是更進一步的整合。

不僅字詞典的編撰已採用自然語言(指母語者真正使用的語言),電腦也一直在處理這個領域,大約在西元2000年的時候,微軟(Microsoft) 的研究人員班柯 (Michele Banko) 與布里爾(Eric Brill) ,希望能找出改善微軟word軟體文法檢查的方法,不管在運算方法或資料量方面他們都去試,現在我們已知道一個事實,資料多要比資料少好,甚至有些時候,資料多比品質好還來得重要,這也引領 Google 研究人員走上類似的路,這恐怕正是“大資料”(Big Data)理念的運用,他們不只用了10億字,而是一兆字!顯然Google的目標不只是文法校正軟體,而是整個語言的翻譯!

展開人類科技與文明發展的軸線,演變絕不是線性的。人類對語言的學習與掌握原本就是動物中的翹楚,如果精通兩種以上的語言,翻譯當然較能駕輕就熟,然而人腦駕馭語言的能力,即便對高速的超級電腦仍有力有未殆之處,就像人可以在一 秒鐘以內認出熟面孔,電腦就需要計算處理龐大的資料才能達成,相信人腦對資料的處理方式有頗大部份遠非電腦可及,但電腦的很多超快速功能亦非人類得以向背。人腦與電腦的合作也許是現今頗值得走的康莊大道,科技如果真的進步到電腦完全可以取代人腦的時候,恐怕又是另一個社會問題的開端。
( 知識學習語言 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=stone9521&aid=7895411