網路城邦
上一篇 回創作列表 下一篇  字體:
中華佛教百科全書(十一) 續 五千三百七十三
2019/09/21 03:28:23瀏覽137|回應0|推薦2
◎電腦佛典
指電腦化之佛教文獻。即將佛教文獻輸入
於電腦中,俾供研究者應用。在近代科學史上
,自第一部電子計算機問世以來,電子資訊的
革命促使應用科學飛躍地成長,而人文科學的
研究領域,也逐漸受到影響。因為利用電腦系
統的結構性,人文學者亦可依自己的研究需要
,請專家設計出所需的程式,以輔助其個人研
究。此外,將資料輸入於磁碟中,除了可隨時
補充資料外,更有易於儲存、保存期限較長、
複製容易、攜帶方便、不佔空間等優點。而索
引類工具書的電腦化,也將會是人文學術界的一大突破。
佛教文獻的電腦化,今已有若干成果。目
前即將電腦化的佛教文獻有︰泰文大藏經、緬
文大藏經、巴利佛教文獻、西藏佛典,及漢文
系的《大正藏》、《卍續藏》、《磧砂藏》、
《高麗大藏經》等大部頭叢書。而正在推行此
種工作的機構則有下列諸處︰
(1)日本花園大學國際禪學研究所、禪文化研
究所、法寶義林研究所、立正大學、佛教大學
、曹洞宗宗學研究所、淨土真宗教學研究所、京都大學。
(2)中國大陸中國社會科學院、北京廣濟寺中
國佛教文化研究所。
(3)台灣中央研究院、佛光山北海道場。
(4)香港中文大學。
(5)泰國摩希德大學、法身基金會。
(6)韓國海印寺、Paeng Nyon佛教文化基金會。
(7)澳洲坎培拉澳洲國立大學。
(8)印度色拉大學。
1993年四月,「國際電子佛典聯合會」在
美國加州大學柏克萊分校成立。美國柏克萊大
學蘭卡斯特(L. Lancaster)被推選為會長。
該會成立的主旨在於提供佛典電腦化以及有關
佛學研究的資訊。各會員團體可迅速獲得當前
國際間電子化佛學的研究動態,以避免重複同
一主題之研究與作業,並且可以透過資訊的交
流,分享佛學研究的成果。
■附一︰川添良幸〈應用電腦處理佛教文獻〉
(摘錄自《法光》雜誌第四十五期)
(一)前言
佛教研究應用電腦,是最近幾年的事。一
般而言,文科系需要大量的資料,作為學術研
究之用,而電腦資料庫的管理技術可以支援文
科系的這項需求,因此,自從此項技術正式應
用以來,其普及的速度,可說相當快。目前,
佛教研究者與電腦的關係,亦如同理科系的領
域一樣地密切了。(日本佛教學者)塚本啟祥
教授,就是促使電腦與佛典結合的中心人物,
其成果廣為學界所知。而透過在日本印度學佛
教學會的發表,掃除了學會既有的電腦恐懼
症。(中略)以下僅將我們數年來應用電腦及
有關科技的始末與一部成果介紹於後。
(二)梵文《法華經》的資料庫化
為了進行以佛教混淆梵語所寫的多種《法
華經》寫本的比對之文獻學研究,八年前即開
始企劃電腦資料庫之建立。所發現的寫本有三
十餘種之多,其來源大致可區分為尼泊爾、西
藏、喀什米爾、中亞等三區域。塚本啟祥教授
費了多年的心力整理,自1977年以五年的時間
出版了《梵文法華經寫本集成》全十二卷。對
所有資料進行客觀性的比較檢討,則必須予以
電腦資料庫化。目前,完成了一、二卷的羅馬
字轉寫與電腦輸入,並且出版;第三卷亦即將完成。
羅馬字的資料(data),經由微電腦的終
端機輸入,以國字標準規格的SQL(Structu
red Query Language)資料庫,儲存在東
北大學塚本研究室的小型電腦IBM9370後,可
經由電腦網路與世界各地連通。不過,梵文的
字碼尚無標準化,我們所用的是自己設定的。
希望如UNICODE(新文字的字碼系統,包
含羅馬字、漢字,甚至梵字天成體、藏文等世
界主要文字),各種文字字碼的世界標準化能
早日實現。梵字羅馬拚音的鍵入,一般字母以
英文鍵盤處理即可,特殊的字則以二至三次的
鍵入為方法(如m!鍵入m與‧),這種方法簡
單易記。至於輸出,則利用電腦的顯示器,及
我們獨自設計的特殊數位系統,由這個系統所
出版的書籍,其印刷的品質最為優良,其鮮明
度即使是最新的雷射列表機也難與匹敵。
我們也完成第一、第二卷總數二萬詞的索
引與逆反索引,其輸出依照梵文字母的順序,
並列出此單字所出現的卷數、頁數與寫本。由
此,對於各種寫本之間單字的差異,可以一目
瞭然。至於逆反索引,我們認為在文法研究上
頗具重大功能。只要一按字鍵,就可在SQL資
料庫管理下的全文中,快速地檢索出所需要的
字詞。而檢索方法,也針對一般不曉得SQL指
令的使用者,特為設計出全畫面介面,只要操
作功能鍵即可輕易使用了。
舉一個簡單的例子,如想知道《梵文法華
經寫本集成》第一卷中,最常出現的單字之長
度與最長的單字為何時,經由電腦的檢索,結
果發現最常出現的單字為七個字母,而長度最
長的字有四十三個字母。
在實用軟體方面,我們開發了單字檢索系
統。只用從終端機鍵入查詢的單字,在畫面上
即可顯出該字出現的頁數,以及列出包含該單
字之《梵文法華經寫本集成》中的那一行。對
於出現多處的資訊,也會列出。經由這個系統
,可以獲得客觀的諸寫本間的基本檢討資料。
目前也正進行著類似單字之比較,及文節長度
分布之比較等研究,據此資料,可作為推測寫
本的系統來源。
(三)佛教寫本記述文字之自動辨識
由於電腦資料庫之建立,使得檢索能夠更
為迅速正確。不過,梵文原典之解讀,僅限於
為數極少的專家而已,這是研究發展上的一大
障礙。對於如何加速資料庫之完成,就得利用
電腦的長處,即資料之自動輸入為研究重點。
英文乃至於日文,均已開發出自動辨識的系
統。不過,這只限於特定的印刷字體,對於手
寫的辨識,尚十分有限。更遑論梵文之電腦自
動辨識,我們這個研究小組的梵字自動辨識成
果,是世界僅見的。
我們以Kern‧南條的印刷字《法華經》
校訂本,作為電腦自動辨識研究之開始。我們
應用形狀比對法與結構解析法兩種作為辨識方
法,對結果加以重複比較與檢討,再予以改
進。形狀比對法以資訊理論為基礎,適合系統
性研究,對印刷字得以發揮威力。至於結構解
析法,接近人類閱讀文字的方法,在原理上適
用範圍廣泛,亦可應用到手寫的寫本上。目前
的成果,由IBM大型電腦3081來辨識,Kern
‧南條校訂本的一行長度,所需時間約為十秒
,辨識率達99%。因此,在此期間所積存的印
刷天成字體達二百種,超過一萬字以上,可說
悉數蒐集一般常用的所有字體種類了。
同時,我們也進行天成體中眾多類似文字
的高精度辨識之研究。依此所開發的方法,適
用於一般文字的辨識,是一項新創舉,我們期
待也能對漢字的自動辨識有所貢獻。
目前,我們正進行木刻版西藏佛教文獻的
自動辨識研究。藏文文獻為比較清晰的資料,
據此可作為手寫文獻研究的開端。不過,由於
文字幅度之不一,行數之重疊,如何克服文字
之斷句,仍是當前的課題。
(四)梵字演變之研究
應用上述梵字自動辨識之研究所獲致之成
果,我們也進行了梵字演變的研究。
不只梵字,文字在歷史上的演變,超乎想
像之外的激烈。特別是對年代久遠的文獻,作
比較文獻學之研究時,其記述文字之變化,是
極為重要的考慮因素。誤讀一個文字,將會造
成全然相反的解釋,因此必須慎重檢討。
我們於收集《梵文法華經寫本集成》中所
出現的全部文字種類時,開始了梵字演變之研
究。起初,對於幾個類似的文字,來進行比較
性的辨識實驗。我們從數種寫本抽出幾個主要
的字,作成標準字體。以此字體來比較其他寫
本,然後確立辨識不同文字之方法。
建立文字特徵一般所用的方法,在結構解
析的最初階段,細線化最為適用。我們收集了
許多梵字,來進行細線化的工作,其成果就是
完成了一部梵文歷史變遷辭典。目前,我們正
在整理將收集到的各種梵字,予以細線處理,
並計畫將結果整理出版,以供想直接閱讀原典
的研究者參考。
(五)以加速器質量分析法來測定佛教史料年代
我們的研究小組,除了電腦之外,也利用
各種最新的科技幫助佛教的研究進行。其中,
先舉以加速器來測定史料年代之例子。
在測定史料的製成年代方面,利用該史料
所含放射性同位元素的比率,可以測知。例如
,碳十四的半衰期為5730年,與不含放射性的
碳十二與其含量作比較,能夠以數百年的精確
度來推定數千年前史料的製成年代。傳統測試
史料年代的方法,是燃燒大量的所測史料,然
後測定燃燒所得的碳,用以推測年代。不過,
在測知年代之後,史料也隨之喪失一部份。最
近,開發出加速器質量分析法(AMS,Acce
lerator Mass Spectrometry),只要用從前方
法的千分之一或萬分之一的材料,即可確定其製成年代。
(六)誦經之音聲辨識
梵語是古印度的文言文,現在已成死語。
不過,大多數的佛典是以佛教混淆梵語記述而
成的,僧侶的誦經亦繼續著這種語言。
我們的研究小組,針對外國留學生的日語
教育,進行了電腦日語會話的自動辨識研究。
其成果也用來作為梵語頌經的試驗。
從塚本啟祥先生處借得《namo tassa bha
gavato arhato samma^sambuddhassa》的錄
音帶,用以進行音聲解析。錄音帶的誦經,不
僅抑揚頓挫,而且伴有法器的聲音,甚難解析。
進行音聲自動辨識,必先完成抽出各種音
素的辭典。對於母音,自動辨識的精確度極
高。可是,一般而言,子音種類繁多,加上類
似音、長短音等等因素,用單純的方法難以自
動辨識。以日語為例,除了母音、子音的因素
之外,還要構築附加一般語言知識的系統,始
能辨識。對於梵語,在考慮同樣的理由下,必
先製成電子辭典,而且也要進行文法解析的自
動化。這類課題,實際上,與文獻之自動辨識
類似,是不可或缺的,更須慎重檢討,再予以克服。
(七)佛學電子公告欄
應用電腦網路所設置的東北大學佛學電子
公告欄,全世界有百餘位佛學研究者參加。平
均每天有十處左右的電子會議進行,而以東北
大學為中心,每天則收到上千通的電子函件。
三年之間,累積了相當數量的電子會議的記錄
,此處已確立了佛教研究者所利用之資料庫地位。
■附二︰塚本啟祥著‧郭敏俊節譯〈法華經電
腦化之研究〉(摘錄自《法光》雜誌第四十五期)
(一)梵文佛典研究的問題所在
(1)傳統的佛典研究
佛教傳入日本以來,長期間佛教之研究都
以漢譯佛典為依據,並且相信佛典所載的都是
佛陀直接的教說,奉之為絕對的真理,而不需
要去求證。因此,對於佛陀的教說,(在日本
)一直就以漢譯佛典與中國所著述的注釋書為
線索,從漢語的語感及語義來理解。及至江戶
時代,長達千餘年所寫成的日本佛教典籍,悉
數具有這種性格。
然而,自江戶時代富永仲基(1715~1746
)著《出定後語》提出「大乘非佛說」之後,
批判性的佛典研究於是開始萌芽。明治以降,
歐洲的研究方法被引進日本,梵語佛典、藏譯
佛典、巴利聖典始為日本人所認識。在此情況
下,同一經典的梵語原典與不同譯本之比較研
究,就具備可能性了。
(2)漢譯佛典的原典
印度傳到漢地所譯成的佛典,一般認為是
自梵文翻譯的。不過,當我們檢討漢譯佛典的
譯語時,發現類似佛/佛陀,菩薩∕菩提薩埵
等譯語,同一個原文有數個不同的譯語。起初
,我們認為前者是後者的略稱,進而,我們發
現同一佛典數度被譯的情形也不少,而這些經
典的構成、內容、譯語差異頗大。據此,可瞭
解佛典的傳譯過程中,語言形態、經典改編以
及各種條件變化的概況。
漢譯佛典的開展過程可區分為古譯(一至
四世紀)、舊譯(五至六世紀)、新譯(七至
十三世紀)。在各個不同的翻譯之間,其語音
的音譯與義譯之譯語均有差異,同時也發現各
個譯本各具其特色。這些特色可視為同一經典
隨著時代之變遷所留下的痕跡。
(3)佛典的語言
佛陀並不是用梵語說法的。梵語是紀元前
五世紀文典家所確立的一種文獻語言,被印度
正統宗教的婆羅門教作為聖典語言。而站在批
判立場的佛教與耆那教等沙門宗教,為了向一
般民眾傳播其教義,則使用各地的俗語(中期
印度的亞利安語,即Prakrit語)。佛教興起
於摩揭陀,也許佛陀是以摩揭陀語說法的吧!
面積匹敵西歐,由多數人種組成的印度,
各地使用不同的語言。隨著佛教之傳播全印度
,摩揭陀語也隨之被譯成各地的俗語。
今日,南方上座部的聖典,即以巴利語流
傳下來。這或許是摩揭陀語轉換成西印度的俗
語,或是受了西印度的影響之後傳入斯里蘭卡
的。總之,巴利語的文法相當完備。另一方面
,北傳佛教在通過梵語文化圈(今日德里周圍
)的傳播過程中,被譯成梵文。當然,這種梵
文化是經過數世紀的漫長時間逐漸形成的。因
此,愈是初期的佛典,俗語的特徵愈是濃厚,
而後世的佛典,則近於古典梵語。這種梵語與
俗語混合之佛典特有語言,稱為「佛教混淆梵語」。
玄奘三藏(七世紀)深感既有的佛典,其
譯語相當混亂,因而西行印度學習梵文,蒐集
佛典請回漢地。玄奘所確立的翻譯稱為「新譯
」。在此之前所譯成各種譯本,是原典梵語化
過程中的經典,於不同時代,在不同的因素下
,傳到中國而被譯的。例如「佛」的俗語為
budh(a),「佛陀」的梵語為buddha;「菩薩
」的俗語為bod(hi)-sat(ta),「菩提薩埵」的
梵語為bodhi-sattva。由此可以推定不同的音
譯是由於俗語與梵語語音不同的緣故。
(4)梵文寫本
所謂梵文寫本,係以棕櫚葉、白樺樹皮、
紙等寫成,容易腐朽。古形的寫本現在不復存
在。中亞寫本的上限年代為五世紀,喀什米爾
寫本為六世紀,尼泊爾、西藏寫本為十一世
紀。由此,保留古形的古譯、舊譯的漢譯佛典
(即現存梵文、藏譯尚未確立之前的古代佛典
),可以提供回溯現已不存的古代梵文原典的線索。
(5)《法華經》的原典與翻譯
今天在日本廣被誦讀的《法華經》,其經
典除了《妙法蓮華經》(406年,鳩摩羅什譯
)外,尚有屬於「古譯」的《正法華經》(
286年譯)與「舊譯」末期的《添品妙法蓮華
經》(601年譯)。這三個譯本,其經典的構
成及其改編、文節插入或欠缺、語彙增刪或置
換等,均有極為明顯的差異。
《法華經》有其歷史性,其信仰運動之實
踐道,以勸人受持、讀、誦、解說、書寫經典
為「師行五種法」,並宣揚其功德,在亞洲地
區廣為流通。其原典寫本,在現存佛典當中,
數量為最多,其出土地域包含︰{1}中亞(五至
八世紀),{2}喀什米爾(六至七世紀),{3}尼
泊爾、西藏(十一至十九世紀)。到目前為止
,經確認的現存原典寫本(含端本)多達六十
種,然而其內容與構成,卻相差甚大。這是原
典寫本在傳承過程中,受到流傳的時代、地域
、書寫者的出身地等等因素的影響,也意味著
原典在音韻學、文法學上的變貌,以及語彙之
插入、修正與文獻組成之改編等等現象。
(6)《法華經》原典的校訂本與問題點
第一本梵文《法華經》原典的校訂本,由
H. Kern與南條文雄整理出版。此校訂本比對
了六本尼泊爾系寫本(十一至十二世紀三本,
十八至十九世紀三本)及兩本中亞系寫本(七
至八世紀),雖然此校訂本將兩系統寫本間之
差異所在予以註記,然尚未臻完善。此外,又
因校訂者本身的理解與研判,難免有將混淆俗
語的原典修正為古典梵文之傾向。此後,荻原
雲來、土田勝彌……等人所整理的校訂本,亦
是立於同樣的編集方針。如同上述,把不同時
代與西域的各個寫本,視為同一,卻忽略了寫
本流傳的系統與形態、使用語言,及文字的特殊
性等等問題。因此,在推論《法華經》原典的工
作上尚殘留著種種的問題。
(二)梵文寫本資料庫化
(1)《法華經》的蒐集與比較研究
為了解決上述的問題點,立正大學法華經
文化研究所,自1966年起十年間,向世界上所
有保存《法華經》的機構蒐集梵文原典的照片
,共計三十種寫本。並且把這些寫本與Kern
校訂本作各行之比對,拍成照片結集成書,於
1977年出版《梵文法華經寫本集成》。
(2)《法華經》寫本之資料庫化
上述的《梵文法華經寫本集成》只能給專
家使用,為了讓一般研究者能夠解讀原典,必
先轉寫成羅馬拚音。可是寫本集成的本文長達
六四八二頁,若是整理作成索引與出版的話,
最少要耗費半世紀以上的時間。因此,我就想
到利用電腦來建立資料庫。在東北大學資訊教
育中心的協助下,立正大學與東北大學的有關
人員,於1986年完成了《梵文法華經寫本集成
羅馬字本‧索引》。
〈#P(3)開發經典編集用的程式
將梵文轉寫成羅馬字以編集經典,並且建
構資料庫,兼具印刷清晰、出版等功能,並且
以個人用電腦與英文打字的連動為前提,在種
種目的的需求之下,我們開發了輸入的軟體程
式,並且製作了梵文表記的活字。
(4)索引用程式
電腦編集經典的一項優點,就是能夠正確
又迅速取得索引資訊。多達六四八二頁的經典
文句;加上全部詞彙的分類,就要有上億的語
文容量。因此,東北大學資訊教育中心利用泛
用大型的電腦,開發出依梵文字母順序的索引
軟體程式,除了具有詞彙索引的功能外,尚可
作逆反索引(Reverse Index)。
(三)資料庫化後的研究課題
《法華經》經典電腦資料庫化之後,我們
發現了新的研究課題,有待研究解決。主要的問題如下︰
(1)語彙檢索系統︰如同Index所能顯示的功
能,即除了所檢索的語彙所出現的頁數、寫本
記號之外,還能夠顯示出包含該語彙的文脈。
(2)文法解析的基礎作業︰逆反索引,就是自
語彙末尾字母逆向語首排列的反索引。語彙的
格變化與動詞變化,會在語尾顯示出來,是為
文法解析的基礎。例如maitreya∕maitreyu*∕
maitreye*雖然是同一文脈,這是「彌勒!」
之意(男性、單數、呼格),前面所列者為梵
文形,*號者為俗語形。
(3)辭典編撰及其基礎作業︰(計畫中)
(4)寫本文字的系統別分類︰利用電腦的自動
解讀與共同作業,對於各寫本的文字之展開過
程與特徵,加以探討。這項工作亦待進行。
(5)文化史的考察︰寫本中語彙之修正與增刪
,顯示出在流傳過程中,文化與思想的交流情
形,這點亦值得詳加考察。
■〔參考資料〕 日本‧花園大學國際禪學研究所《
電子達摩》(The Electronic Bodhidharma)。
( 知識學習檔案分享 )
推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=y72717015e&aid=129582047