●《客語語料庫》客家新聞雜誌第687集
【客家新聞Hakka News/發布日期:2020年3月19日】
為了搶救流失日益嚴重的客家話,除了透過研究、教學來推廣保存,您還有想到什麼方法呢?客委會從106年起,開始啟動”台灣客語語料庫建置計畫”,這個台灣第一個本土語言語料庫,預計111年底會正式上線,在政大的建置團隊裡頭,除了有語言學家,更包含資訊專家及傳播學者,大家共同思考要如何將這一筆筆,費時費力仔細收錄起來的書面文字及口語語料,讓電腦如何”學得會”,之後如何透過結合AI技術,開發出更多應用在長照、翻譯、教學等面向的應用加值,更是團隊成員努力的目標。
來源:https://youtu.be/zesVu3jZyhw
●客語語料庫導入AI技術 保存客家文化-民視新聞
【民視即時新聞/發布日期:2019年11月29日】
為了保存客家文化,呈現客語全貌,客委會建置台灣客語語料庫,逐步將文字及語音數位化。目前書面語料已有500萬字、口語語料10萬字,三年後將正式上線。不但是全台灣,也是全世界第一個由官方帶頭建置的客語語料庫,還導入人工智慧技術,宣示開創客語AI新時代!
來源:https://www.youtube.com/watch?v=_7IAqDpZJO0
●本土語料庫首創 「客語語料庫」擬3年後上線
【客家新聞/20191129】
面對數位新時代,客語也要與時俱進,客委會從106年開始建構,台灣客語語料庫系統,建立台灣第一個本土語言語料庫,目前已有階段性成果,預計在111年底上線,將這些珍貴的語料保存,未來能在教育,研究跟翻譯上有更多的應用。
來源:https://youtu.be/lBrZGbMlIn8
●保存客家文化!「台灣客語語料庫」將在民國111年上線!
【年代新聞CH50/2019年11月29日】
為保存客家文化,呈現客語全貌,客委會是投入6000多萬經費,建置客語語料庫,將文字以及語音數位化,成為台灣第一個「本土語言的語料庫」,目前已經有500萬字的書面語料以及10萬字的口語資料,預計民國111年底會將會正式上線啟用,有助於客語發展以及保存客家文化。
來源:https://youtu.be/IsHIfIkgxKE
●臺灣客語語料庫試用版正式上線(2021.12.24) https://corpus.hakka.gov.tw/
※客委會報導:https://www.hakka.gov.tw/Content/Content?NodeID=34&PageID=45241
「臺灣客語語料庫」試用版上線 數位應用廣泛【客家新聞20211224】
(客家新聞Hakka News)
臺灣第一個本土語言語料庫「臺灣客語語料庫」試用版,24日正式上線,語料庫是由客委會委託政治大學規畫建置,目前文字和口語已蒐集超過600萬筆資料,客委會表示,將客語文字及語音數位化,有助於客語研究及教學發展,未來更可望結合AI人工智慧技術進行語音辨識、即時翻譯等數位處理,讓客語發展迎上時代潮流。