字體:小 中 大 | |
|
|
2024/08/07 17:56:50瀏覽1198|回應0|推薦2 | |
從AI公共化來看政府、學界與民眾的角色 作者:王道維[1] (全書下載連結) 摘要 由人工智慧(AI)技術所領導的第四次工業革命已經來到,很快將帶給我們生活各面向的改變與全新的挑戰。但是與過往三次工業革命最大的不同之處在於:AI並非奠基於自然科學定律上,而是建立在數據與演算法上所創造的模擬能力,成為一個可能在某些或許多方面的代理人。這個根本上的差異造成如今在資料、技術、人才、資金與應用場域集中於大型科技公司的「AI資本化」現象。在此脈絡下,筆者說明為何「AI公共化」成為一個幾乎無法避免且需要更加努力推動的方向,特別需要政府、學界和民眾一同攜手合作。這個「AI公共化」可分幾個階段,首先政府部門要能有效掌握與釋出公共資料和研發經費,引導人文社會學者與AI技術學者以跨領域合作的方式來研發推動公共服務的AI應用,使得社會大眾都能分享AI發展的果實。其次,由於人社領域學者對AI研發的參與,才能引導相關的政策與法令配套有合理的調整,減少將來應用於社會的衝擊或避免不必要的嚴格管制。最後才是藉由新創企業與中小企業所參與的AI公共服務產業鏈,與掌握通用型AI技術的大型科技公司重新架構出健康的生態環境,其中包括資料取用監管、基礎設施搭配、技術開發傳承、資金擴散流動、人才培育分工以及法令規範配套等等重要面向。民眾在這過程中不但是科技產品的受益者也可能是風險承擔者,需要藉由公共參與和消費行為調節政策方向與產業發展。這種公共化所引導的AI科技發展才能逐漸落實於社會共同利益,紓解AI資本化所帶來的許多社會、經濟、教育、法律或倫理方面的問題,一同增進社會全體的共善。
一、背景:過去三次工業革命的物理學基礎 要正確評估AI所代表的第四次工業革命對人類歷史的意義之前,筆者認為我們需要先清楚的瞭解AI科技與過往的科技發展在本質上的差別。這樣才能讓我們了解也許政府、學界與民眾的角色與過往又有何不同。因此,以下我們先簡單回溯過去200多年來前三次工業革命的科學本質,避免受到過往科技發展脈絡而錯估AI的影響[2]。 首先,18世紀末蒸汽機被發明,代表人類第一次的工業革命。當時科學家應用了物理學所發展的熱力學理論,將非生活中存在的自然力量(大量煤炭燃燒)引入到工廠,產生巨大的推力來取代大量的人力勞動。這項發明為人類的生產和運輸方式帶來翻天覆地的變革,促進資本主義的興起,當然更大量消耗天然資源與對環境產生嚴重的破壞。 第二次工業革命則發生在19世紀,關鍵性的突破在於電磁學的發明和應用。這項新理論使得人類能夠利用蒸汽產生的電力,藉由電動機轉換成交流電而將電力有效地輸送至遠方,讓能源與電力的運用不再受到地理位置的限制。就如同現今,發電廠通常不會蓋在都市,卻都是傳到都市裡來滿足眾多人口的需要。此外,電力還可以有效的轉換成其他形式的能量(如光能或熱能),更可以隔空傳遞訊息(電磁波),為人類的生活帶來無與倫比的舒適和便利。這一切的根源都源自於電磁學的理論突破與應用。
第三次工業革命則是源自於半導體的發明和應用,其背景是量子力學。這項科技不僅促進了電腦與手機等日常3C硬體產品的出現,更藉由資訊和通訊的傳遞,串起網路的虛擬世界,開啟了嶄新的大門。以上筆者特別提到了熱力學、電磁學和量子力學,因為這三大類型的物理學理論與應用,正分別為前三次工業革命奠定了堅實的科學基礎。因此,過往這些革命性的科技發展都有自然科學的理論支撐,也代表存在著先天的限制與規範。任何科學家或工程師只能在可行的範圍內發揮。也就是存在著「是否符合自然定律」的命題,並且只能為真而不得為假。
二、AI帶來的第四次工業革命的關鍵差異 然而,當我們目前仔細思索AI所帶領的第四次工業革命,就會發現其背後的理論基礎不是物理學,而是演算法。用白話的語言來說,就是數字的計算擬合(fitting)。從物理角度來看,真實存在的是桌子、椅子等物件,必定符合某些物理規律。但是藉由大量參數而完成的數學計算本來就只是複雜的函數,並沒有本質上的意義,只是可以模擬出看起來就像是真實的東西。 因此,我們首先要排除AI將來會變成有血有肉的人類這個想法。例如哲學界還有些人會討論它是否有人權或公民權之類的[3]。筆者個人認為這完全是多慮了,因為AI甚至不是生物,插頭拔掉或電池沒電就無法運作。所以對於AI我們第一個需要理解的事實是,雖然其技術的進步讓人類認為它很像真實的,甚至引發我們真實的情感[4],但是其本質是虛擬的,是徹頭徹尾都是假的。這是因為AI技術的本質就不需要符合物理定律的規範性,因此沒有真實與否的問題(全是假的),反倒是在追求「夠不夠像」的問題。只有在這樣的架構下,我們才能比較了解AI該如何進入我們的社會,並且為其應用與效果作正確的評估。 舉例來說,2022年11月底由美國OpenAI公司所公布的ChatGPT橫空出世,以流利的對話能力驚艷世界。過去一年多來幾乎每週都有一些與生成式AI相關的重大新聞[5]。事實上,在本文撰寫的二個月前(2024年2月),OpenAI又發布造成轟動的Sora,可以用簡單的文字描述就直接生成擬真度極高且流暢達一分鐘的各式影片,一夕間讓許多影視產業蒙上陰影[6]。筆者也曾經指出,從技術面來說,這些生成式AI驚人的多模態與跨領域通用技術都是奠基於對於大量語言文字的學習結果[7]。因此只是模仿了人類可以共感的表達方式,並不需要有人類的靈魂或知識。如果真的要歸類,類似ChatGPT這類生成式AI所產生的內容比較適合歸屬於「虛擬知識」,是個可能有參考價值但是需要不斷檢驗的文字生成結果[8]。但是這樣的虛擬知識在相當程度上已經可以進入我們的生活,帶來巨大的影響。 事實上,生成式AI的發展也正是朝向通用型人工智慧(Artificial General Intelligence, AGI)的路上所必要的關卡。所謂AGI,不僅能與人對話溝通,更能實際執行各種動作,也就是「多模態」的AI。例如最近OpenAI剛發布的GPT-4o[9],就能很流利的同時執行文字、語音、影像與圖片之間的多層次交流,幾乎彷彿就像電影中的雲端情人或超級助理。例如新創公司Figure發表了結合ChatGPT與人形機器人實作服務生的影片[10],開始可以直接與人類對話並以此產生正確的動作來回應,展現出更加精細的動作和通用的行為能力。過去AGI的實現被視為遙不可及,但如今看來,它的到來只是遲早與定義的問題。
三、AI在應用上為代理人(Agent)的定位 為了更好說明「通用型人工智慧」(AGI)在應用上可能的情況,筆者以已故物理學家史蒂芬‧霍金(Steven Hawkins)為例。他除了是一個極為知名優秀的天文理論物理學家以外,他本身也是一個漸凍人,所以他的全身幾乎都無法動彈,只能靠眼球或些微但模糊不清的語音來與外界溝通。這樣的一個人我們一般很難想像如何可能與一群活潑亂跳的孩子互動。假設我們有個通用型的AI,他會包括幾個重要的部分。首先,可以想像他會有一個AI語音處理器,可以將他不清晰的口語或眼球運動轉換為語言(經過一些訓練),並將結果透過大型語言模型(Large Language Model, LLM)的解讀,轉化為程式的參數來指揮一個人型機器人代為與孩子互動,例如玩遊戲。機器人流暢的動作會獲得孩子回饋,透過機器人的電腦視覺(也是另一個AI),以及與藉由環境中各種感知器可以蒐集孩子的聲音、動作或表情,於雲端計算整理後再回饋給AGI處理器,透過語音或螢幕讓霍金感受孩子的反應。這個AGI系統在這過程中扮演著大量資料與語言文字處理的角色,讓本來幾乎無法與世界互動的霍金有可能與孩子交流,享受有趣的時光(見圖2. 1)。這裡要提醒的是,如同圖2. 1所表達的,當事人感官可以見到的部分是只有霍金、機器人與孩子,但看不見的地方(如感知器、雲端計算、與大型語言模型等等)才是AGI真正發揮功能的部分。
圖2. 1 從功能面來看的通用型人工智慧(AGI),是連接人類思想、情感與行動的代理人。 四、AI公共化的核心問題:它代理了誰? 如果我們先定位AI或AGI的角色是代理人,除了關注AI的技術層面「夠不夠像真人」之外,也就比較能開始思考其倫理定位的問題。雖然對此有許許多多的學者從哲學、倫理學、經濟學、社會學、心理學或法律司法等等角度提出不同的看法,也都有非常重要的洞見,但筆者認為一個比較容易被忽略的重要問題是,AGI到底是在代理誰?是那些已擁有權勢、能力、金錢和地位的人,讓它們可以更快速有能力的累積管理財富資源?還是那些本來就無法表達、少有資源、或難以與他人互動而屬於非主流且不為人知的弱勢族群?這才是AI最重要的價值所在,也就是追問AI到底要為誰代言與服務。 在說明AI公共化的定義與內涵之前,筆者需要先闡述提出AI公共化的背景[11],其實是源自所謂的「AI資本化」的現象。這是指擁有雄厚資金的跨國性大公司成為AI先進技術的開發者以及優先使用者,此情況與過去的科技發展與工業化過程完全不同。這些大公司都是讀者耳熟能詳的,主要是美國的公司如Google, Facebook, Microsoft, Amazon, 與最近興起的OpenAI等等。當然其他國家(如中國、歐盟、英國、日本等)也都有類似或甚至國家支持的企業參與其中。 這與過去工業發展的情況大為不同:雖然業界的主管職務多半都比教授有更高的待遇,但並不一定能讓優秀的教授願意離開校園。這是因為過往的科技與相對應的工業技術主要的創新還是來自於校園的實驗室,是透過政府的研究經費來作可能不符成本的基礎科學以及容許多次失敗的創新研發。研發的結果主要是論文的產出,然後有部分透過技術移轉的方式往業界釋出。產業界的角色主要是應用這些新的技術或研究來作大量生產,降低成本,開闢市場與客戶。更何況產業的研發與上市充滿許多不確定性,尖端的技術並不一定能吸引到適當的買家,而相關的投資也可能因為社會風潮或市場競爭而毫無回收。因此對於有研究興趣的大學教授而言,並不見得願意投入業界實作,反而希望是扮演教育者與研究者的身分。最後,大學多由政府支持,可以自由地發揮比較少限制。來自社會各界的學生進入校園,討論公共議題與價值,故仍保有公共凝聚與發展的力量,是整個國家社會的公共財。 但是在這股公共力量正被AI資本化趨勢逐漸抽乾,畢竟這些公司不僅資金雄厚,更重要的是掌握AI訓練需要大量數據資源。一般學校或研究機構的經費很難與之競爭[12]。有了龐大的數據和資金,自然更容易吸引頂尖人才的加入。事實上,目前情況是這些科技大公司正大舉吸納學界人才,知名的資工教授幾乎都被拉去(或被詢問)到業界擔任顧問或主持大規模的開發研究。這不只是薪資的問題,更有大量的數據和硬體設備,讓頂尖人才可專注有趣的AI演算法研究,並將成果讓全世界使用,又不必寫論文發表。事實上,目前最好的AI論文幾乎都是由這些大公司所發表的,學界已經從AI研發的主角變成了配角。這樣的惡性發展當然就會讓AI資本化的負面影響越來越嚴重,侵蝕整個民主社會甚至人類文化運作的根基(大型語言模型透過大量文字生成對於人類未來文化的影響才剛開始)。
五、AI公共化的內涵與運作方式 讀者可能會認為,AI資本化的情形已經那麼嚴重,需要龐大的資金和尖端技術,如果連比較能掌握技術或知識的學術界都無能為力,是否還有任何方式來作合適的調整呢?畢竟在民主國家中,政府不能隨意取用民間企業的資產,而資本主義的社會也不允許政府過度的市場干預。。 筆者此處可以再次說明,AI科技是一種與過往奠基於自然科學基礎上的技術有所不同。其中一個特殊的地方在於它需要從資料來源到應用場域的各個環節結合在一起才能發揮效用(見圖2. 2),不是只有技術或經費就可以完成。以汽車的製造為比喻,我們都知道汽車最重要的部分是引擎。但是如果沒有輪胎、座椅等其他設備零件,再好的引擎也無法發揮功能,將人載到遠方。此外汽車也需要汽油或電力來驅動引擎或馬達。也就是說,這些外在環境也是讓汽車得以發揮功能的必要條件,也就是政府與整個社會可以更積極參與的角色。或者反過來說,汽車製造完成就是要給人開的,同樣AI作為代理人就是要看代理了誰。如果我們並未在AI發展的這些可以參與的過程中積極參與或監督整個過程,這部「AI汽車」最終勢必還是會被有錢人買走,或是無法成為社會更多人可以使用的代理人。 圖2. 2 AI技術落地發展的三大領域與其背景環境[13]。
因此,從圖2. 2即可知道,我們仍有公共參與的可能性,包括相關教育培訓、資源配置和法規等等。只是這些都需要整合規劃,無法獨立分開或亂槍打鳥。如何整合這些資源或規範,就是所謂的AI公共化的內涵。 此處所謂的「AI公共化」已經在筆者過往的文章中有較為仔細的定義與分析[14]。簡而言之,就是藉由政府部門主動釋出公共資料,讓人文社會學者與AI技術學者以跨領域合作的方式來研發非營利導向的AI應用,使得社會大眾(而非少數私人公司)都能分享AI發展的果實。相關的政策與法令配套亦可因為人社學者從AI設計之初的介入而提早預備,間接引導相關技術的開展而減少將來應用於社會的衝擊,使科技發展與社會公益在AI時代中更能相輔相成,一同創造更大的社會共善。 因此,這個產官學界三位一體的AI公共化,就是希望在公共領域積極導入AI相關的服務,建立社會價值與基礎建設的正向循環,創造整體更大的效益並降低AI相關的風險疑慮(圖2. 3)。雖然「AI公共化」並不能解決「AI資本化」的問題,但是透過積極開發更多正面應用價值與創造公共利益的AI系統,可以更為有效積極的面對發展失控、隱私保護或資訊混亂的問題來強化目前的技術與相關法規,間接讓社會更有成熟的體質來面對AI時代的挑戰。這個概念就相當於將本來會傷害人體的病毒減弱作成「疫苗」,注入人體來強化自體免疫的能力。畢竟未來AI的發展是否會失控,還是有很大的程度決定於一般人使用時的警覺與堤防自覺,不大可能完全用法律就能完全禁制得了。
從圖2. 3可以看到,人文社會和法制領域(最上方圈)通常會對AI發展抱持憂慮,因為了解它可能帶來經濟、人權和安全管理等層面的危機,但是產業界(右下方圈)則希望全力衝刺,避免被取代。兩者存在明顯衝突。本文所提到AI公共化,旨在創造另一個維度,將AI技術引入讓大眾直接獲益,並從大眾反饋回到AI相關研究,形成正向循環。細節可參閱我們的文章。簡單說,我們並非要抵擋AI資本化(可能難以抵擋),而是希望通過公共化紓解資本主導可能造成的未來社會問題。 圖2. 3 AI公共化(左下的區塊)可打破原來社會規範(上方區塊)與產業發展(右下方區塊)對立的局面,轉動產業發展與社會關懷的良性循環,創造各方多贏局面,帶來更大的社會共善(圖片來自註[13])。
六、兩種AI的公共化應用 筆者曾在別的文章中發表過[15],AI的公共化有兩條發展的路線:一是利益加值型,即運用AI優化既有的科技應用,為企業創造更高價值。二是溝通協調型,讓原本難以溝通的族群透過AI介入而得以流暢對話,建立社會共識。前者雖重要,但顯然已為許多企業所重視,因此筆者認為政府與學界應著力於後者才能更平衡的發展。畢竟,我們的社會在邁向「去中心化」的後現代過程中,已經經歷到越來越多因為族群、階級或世代之間的價值觀而有的衝突,甚至法律糾紛,正逐漸侵蝕瓦解許多當代社會有效運作所倚賴的共同價值[16]。 因此,我們可以發現AI對於大量非結構性資料的處理能力,特別是如今以ChatGPT為首的生成式AI,應該會有助於讓過往不同觀點的資料可以充分的再利用,補充各族群所看不到的相異觀點,應該有機會促進不同族群或利益當事人之間有更高品質的對話溝通。這是過往以硬體設備為基礎的科學技術所無法達到的功能。 這類「溝通協調型」的AI模型其實並不是新的,有些甚至已經在開發或是將要被實際應用。其中可能最為大眾所熟知甚至也已經在使用的就是AI語音翻譯的功能,讓兩個不同語言背景的使用者可以有更好的溝通與對話。此外中央研究院也有開發出能夠協助語言障礙的人事與外界溝通對話的AI輔助工具[17]。 筆者此處補充另一個自己所主導開發的AI系統作為例子:AI輔助親權裁判預測系統[18]。此系統設計的背景是,其實大多數離婚案件本可透過調解程序有妥善的解決,避免白熱化的司法訴訟戰。但是當事人往往因為對法官判決的了解不足,容易聽從律師的建議而採取對抗策略以求保護自己撫養孩子的權益,反而加劇了家庭矛盾。筆者曾經與台北地院法官討論此一困境,獲知關鍵癥結點在於缺乏權威第三者的中立見解來介入調解。有鑑於此,台北地院特別設置了兩名專職調解法官。事實上也發現,當調解法官介入調解時,雙方當事人較願意傾聽中立專業的法律見解,調解成功率也大幅提升。然而,全台灣其他多數地院卻未能複製此一機制,主因在於法官一職本已事務繁重,難以長期擔任調解工作。 因此,筆者所開發的「AI輔助親權裁判預測系統」,即是以台灣各地方法院家事法庭的離婚後親權酌定裁判書作為訓練資料,經過法律團隊的專業標註資料來訓練AI模型,可以用於在父母雙方都有意願爭取親權的情況下,預測法官裁判未成年子女的親權歸屬。目前最新的版本已經有功能上的更新,加入生成式AI的協助功能,更符合「可信賴的AI」的設計。在實際使用時,可以藉由第三方(如家事調解員)的協助,讓有親權爭議的父母雙方可以根據AI所展現出來,藉由過往法官裁判的結果創造調解的空間,也更了解法官所在乎的「子女最佳利益」。這應該能促進雙方提早作好準備,積極作庭外和解,減少對簿公堂、避免大量訴訟費用、減少在法庭中互告時對家庭更大的傷害,更可能減少法官案件積累的壓力。此系統目前已經開始開放使用,也正積極與各地方法院合作[19],希望能實際產生影響與效果。
七、AI公共化過程的幾個階段 本文所提及的「AI公共化」並非一蹴可及,而是需要經過幾個階段來完成。 第一階段:政府制定政策分批有效的蒐集並釋出公共資料 AI公共化包括幾個重要核心,其中最重要的就是政府。因為AI系統需要大量資料。除了網路上的公開資料外,政府手上掌握了我們每個人的個資、納稅、交通、教育和司法等數據,這些都是國民的寶貴貢獻,也比較沒有落在民間企業的手中。因此這類更為重要(相較於網路資料)的資料該如何適當的整理、開源、或保護,是決定未來AI公共化的成敗關鍵。畢竟網路上所有查得到的公開資料幾乎都會被拿去私人企業作訓練(不管是否合法),但多半無法有效的反應出特殊族群或語言文化的狀況(因為強勢文化自然有強勢的網路資料)。但政府手上的資料,除了部分國防機密、社會安全或個人隱私相關以外,在適當的去識別化或處理過,是有可能更為在地化且幫助到貢獻這些資料的人民。政府應該善用這些公共資料,以公共利益為目的訓練AI模型。這不僅能發揮資料價值,也能避免AI過度被資本主導,實現較為公平正義的發展模式。 第二階段:人文社會領域的學者參與資料分析與整理 但這馬上有個問題是,這些資料釋出給誰?社會大眾嗎?當然就會有風險的疑慮。而且一般人也不需要這些資料。如果這些資料不是給私人企業處理,有能力處理的自然是學術界了。所以筆者已經在許多文章或演講中提出,如果能夠透過政策誘導,將各部會或地方政府所掌握的公共資料釋出給學界使用,特別是人文社會領域,因為舉凡經濟、司法、政治、教育、社政、外交等等,幾乎大部分的重要資料都是關於人文社會領域的內容。 但是傳統上我國大部分人社領域的學者多是質性研究為主,不太熟悉處理大量的資料,因此這部分就需要有國科會與教育部等部分的研究計畫誘導,藉由標註或數位化將這些資料逐漸的整理成為有結構性,且具有研究價值的資料,甚至藉此改善資料蒐集的架構與編排的邏輯,讓相關的部門可以更有效的看到這些資料對許多政策制定或解決方案所帶來的重要影響。此處很重要的一點是,這些資料整理本身就可能是有相當重要的研究結果,所以對參與其中的人社領域的學者也是有很大的幫助。這種互惠的方式才能讓政府與學界同蒙其利,也讓這些資料的價值能真正被發揮,而非只是一團數字或硬碟空間,無法為我們的政府政策或人民福祉提供更好的評估。 第三階段:資工技術領域與人社領域的學者合作開發適合的AI模型 當資料被適當的整理好,也就是資工技術領域的學者可以有效發揮的時候。如果是為了開發AI模型,嚴格來說, 技術端應該在一開始就介入資料標註與整理,才能提供有效的格式化建議讓整理的資料能夠被AI更好的使用。這部分需要跨領域團隊的建造,也有在本人過去的文章中提過[20]。這種跨領域合作並不是容易的,但沒有理由因此停下腳步。假設這部分可以完成到一些階段,資工技術學界便可獲得這些特殊且寶貴的資料來訓練獨特的AI。 這個AI模型可能不會是大型語言模型,因為那牽涉到語言資料的數量比例差異的問題(繁體中文遠少於簡體中文,造成效果不彰)[21]。筆者建議先以監督式學習等具有目標的AI應用為主,再輔以適當的大型語言模型的支援。也就是由下往上的開發,而非一般企業由上而下的套用大型語言模型。這當然有其戰術面的理由,畢竟學界的AI技術發展與硬體設備難以與大型私人企業競爭,但是著重在資料端與應用端會比較有其特色而難被取代。更重要的原因是,這些由學界開發的AI應用一開始就可以服務於部分民眾的需求,而非僅服務於少數財團或原本就已擁有權力和經濟地位的人士。透過這種做法,我們就能稍微平衡AI在發展過程中原本存在的嚴重失衡情況。 第四階段:利用AI改變研究資源配置於跨領域的實務研究 我們現有的學術評鑑制度過於重視論文發表數量,卻忽略了論文對社會實質貢獻的考量。本人作為物理系的教授,當然知道基礎科學或基本人文研究的重要性是不可忽略的。所以以上並非輕視基礎研究,而是希望基礎研究雖然並不強調即時的應用性,但也並不等於就可以只看論文的數目來作為遮掩的理由。而以AI這類更是快速應用發展且跨領域展現的方向來說,寫論文就更不見得有太大的價值。畢竟,這些學術論文需要有大量的文獻、仔細的研究,以至於撰寫的速度太慢,發表時間也比較久,很難跟得上相關的發展。此外大量無益的論文反而讓後進難以消化,多數難有實質的貢獻。理想上,基礎研究有若干持續的產出(不一定是論文)而可以看得見進展即可。重點是如何開展出其他的評估面向,讓這些知識能夠轉成有益於社會的面向。 更重要的原因是,AI的發展本質上就是跨領域的。所以前述所說,如果要鼓勵人文社會領域與技術領域的合作,論文會是一個很容易卡關的地方。因為跨領域的研究比較不容易在各自的研究領域中得到傳統研究者的青睞,畢竟會牽涉到新的研究方法或甚至還未成形的許多假設與測試階段。這對應用發展如此快速的AI來說,只是徒增麻煩。如筆者前述,在AI資本化的情形下,被吸引到大公司的研發人才不需要寫論文,而是直接透過終端產品的實際功能來展現其價值。因此學術界在推動「AI公共化」的跨領域合作時,這部分也應該要偋棄學術成見,而經費提供單位(如國科會或教育部等)也應該放棄這樣僵化的評鑑標準,才能更快的推動AI公共化的落實。 第五階段:優化AI落地的法制規範與政府治理方式 當更多人文社會科學領域的學者與資訊工程領域的學者展開緊密合作後,其中一個重要的影響是,參與的人社學者(特別是法律人)能更直接了解AI的開發過程以及理解AI的運作方式。這樣他們在日後協助制定與AI發展有關的法律規範的時候,就比較能夠擬定切合實際的文字或方向,而非像如今單憑個人的想像或新聞報導而對AI發展有錯誤的估計。 舉例來說,台灣大型語言模型推動的主要障礙之一,除了算力就是資料量的不足。而資料量則卡關於著作權法的限制,使得模型無法直接使用公開的網路資料或未經授權書籍文章內容來作訓練資料。雖然著作權法的初衷是正當的,但它制定之時未能預見大型語言模型等新興科技的發展,因此難免產生矛盾:一方面需要藉由開發繁體中文的大型語言模型來保留繁體中文的資料,但一方面又不願意修法讓這類資料作更有效率的應用於大型語言模型。倘若政府能修法,讓著作權法保護的資料可以獲得優質的數位化處理,並讓更多學者參與精緻的資料整理工作,勢必能為大型語言模型的發展注入新的動能。在此過程中,政府的角色應有所轉變,效法日本修改著作權法的作法[22],允許語言模型直接使用已公開的資料,僅需在應用端加以必要的限制,而非完全禁止使用公共資料源。 另外的例子是,目前政府的公共資料缺乏標準化,很難在AI領域發揮足夠價值,造成了一個資源浪費的惡性循環。但若政府藉由AI公共化的大方向,積極推動政府開放資料的標準化,讓學界可以更快速的使用,就會形成一個良性循環:政府資料會越來越標準化、透明度越來越高,也就越容易被上傳使用和廣泛採用。同時,整個政府的治理方式就會越來越有效率,不再僅僅依賴於某些領導人的個人管理風格和政策,更能根據真實且標準化的數據和科學分析,做出更明智的決策,提升整體的公共事務效能。總的來說,AI公共化可以創造一個多贏的局面,既惠及人民大眾,也有助於政府自身的現代化和科學化治理。 以上的例子可以說明,透過AI公共化,讓各領域的學者參與,將或可紓解AI發展與法治面及產業界之間的矛盾與衝突。 第六階段:學界研發成果產業化 台灣目前大多數AI技術相關的公司,主要集中在工商業界,為了提升其企業的營運效率,或是參與某些硬體軟體的代工,可以說是一種利益加值型的AI應用。雖然這是企業發展所需,但卻可能忽略了AI對於一般大眾的助益。事實上,AI公共化最寶貴的意義並非僅在提高單一企業的獲利,而是能夠造福更多民眾,特別是連結弱勢與邊緣族群,成為他們的代理人來表達需求,與社會主流接軌。 因此,我們冀望學界在AI領域的研發成果,能夠導入產業界並創造實質的價值。這裡所說的產業界當然就不是前面所講的大型企業,而是台灣有許多的中小企業。他們本身無法支援這些AI的技術或資金。但是透過政府釋出的資料與學界跨領域的合作,最終所產生的產品應該有機會藉由社會企業或中小企業的模式來營運,為更多民眾服務創造更好的服務,將AI普及到不同階層的需求,開拓AI時代另一條生存之路。
八、結語 總結而言,在已經來臨的AI時代,我們迫切需要來自不同領域的人才參與其中。除了業界的投入外,政府更應該主導AI公共化的相關發展,也讓學界承擔起應有的責任來作跨領域合作,開發出有促進溝通協調型的AI,促進社會共識的形成。這不但有助於政府的資料治理,也能促進中小企業的AI生態圈。至於民眾,作為AI應用的最終受益者,理應積極參與並給予監督意見,協助AI公共化的落實。 在AI資本化浪潮已席捲而來的當下,現在可能是最後的機會來推動AI公共化。若現在不急著早些將公共資源妥善導入AI發展,讓更多學者有機會參與數位資料處理,恐怕無法平衡AI資本化對於社會的衝擊。相反地,若AI公共化能積極的推動,真正發揮溝通協調不同族群意見的功能,有效減少社會各族群間的隔閡與紛爭,促進社會共識的形成,AI也將化身為造福人群的公共財。在此格局下,政府的AI治理也將更精準到位,企業所需的AI人才自當源源不絕,也將研發經費與人才適當的保留於學術界,創造比較平衡的未來社會。期盼透過全民共同的努力,讓AI公共化落實成未來世代繼續健康發展的土壤。 [2] 以下這段的文字是參考自筆者過往所撰寫的文章,另行修改而成。可參考,王道維與林昀嫺,「如何用AI創造社會共善?──AI公共化的契機」,台灣人工智慧行動網 (8/14/2020)。引用網址:https://ai.iias.sinica.edu.tw/how-to-create-common-good-in-society-with-ai/。後續有些微修改或補充,可見於筆者的部落格:https://blog.udn.com/dawweiwang/148733003。 [3] 高敬原,「機器人真的需要公民權嗎?三個層面來探討」,數位時代(10/31/2017)。參考網址: https://www.bnext.com.tw/article/46782/robot-rights-citizenship-saudi-arabia-sophia。 [4] 「比利時男子「沉迷和AI聊天」6周後輕生亡 詭異對話曝光」,ETtoday新聞雲(3/31/2023)。引用網址:https://www.ettoday.net/news/20230331/2470681.htm#ixzz82m8piykV。 [5] 生成式AI是AI眾多演算法之一。以ChatGPT為例,是負責將輸入的文字資料轉換成另一些文字資料輸出,但後者的輸出可以是前者的對話、翻譯、查詢、延伸、歸納、摘要、解答等等各種不同的關係。而其他種的生成式AI可能以圖像轉圖像,或以文字與圖像之間互換,或其他更多如文字、影像、語音、影片、行動等等各種資料模態間的轉換生成。即使同樣功能的生成式AI也會因為訓練資料與模型設計的不同而有相當大的差異。 [6] 可參考,「Sora 恐讓影片創作者失業?專家:強化「這點」免被 AI 取代」,經濟日報(3/10/2024)。引用網址:https://money.udn.com/money/story/5612/7821204。 [7] 王道維,「當Google遇上ChatGPT──從語言理解的心理面向看AI對話機器人的影響」,風傳媒(2/11/2023)。引用網址:https://www.storm.mg/article/4725780?mode=whole。後來增補的版本亦可直接見於作者王道維的部落格原文: https://blog.udn.com/dawweiwang/178350327。 [8] 王道維,「迎接「後知識時代」的來臨---從生成式AI的虛擬知識談起」,風傳媒(3/31/2023)。引用網址:https://www.storm.mg/article/4766772?mode=whole。後來增補的版本亦可直接見於作者王道維的部落格原文:https://blog.udn.com/dawweiwang/178728006。 [10] 可參考,「OpenAI 加持!AI 新創 Figure 人形機器人能與人任意交談與互動」,科技新報(3/14/2024)。引用網址:https://shorturl.at/diqsw。 [11] 可參考筆者為國科會人文處所拍攝的「人文社會AI導論課程」第十集,「AI公共化的願景」(2021)。影片網址:https://www.youtube.com/watch?v=sWLNO_31DBo&list=PL_qamH512zu6NbUEDShUFyHiE7qHUGJiN&index=11。 [12] 舉例來說,中研院預計2024年花費1億元買進72片NVIDIA的H100運算卡,但Meta今年(2024)就要買35萬片,超過NVIDIA一年產量的半數,根本無法相比。這顯示已不僅僅是技術或資金層面問題。可參考,從Meta積極於2024年購買35萬顆H100,得知短期內輝達地位難撼動,科技產業資訊室(1/22/2024)。參考網址:https://iknow.stpi.narl.org.tw/post/Read.aspx?PostID=20369。 [13] 王道維,「打造跨領域AI的研究經驗」。出自林文源、王道維、杜文苓與李建良編著,《公共化AI:技術、協作與展望的基礎設施》第三章,國立清華大學出版社。初稿最先發表於王道維的部落格,〈如何進入AI公共化相關應用研究:一些個人經驗與心得分享〉,4/17/2019。引用網址:http://blog.udn.com/dawweiwang/125378006。 [17] 可參考,「中研院開發「AI口語溝通輔技術」協助改善溝通障礙、提高學習效果」,民視新聞網(11/23/2023)。參考網址:https://www.4gtv.tv/article/2022112301000005。 [18] 「AI輔助親權裁判預測系統」的公開網址:https://hssai-custodiai.phys.nthu.edu.tw/。 [19] 可參考,「臺灣臺北地方法院AI研討會掀起司法新紀元 智慧調解提高雙贏機率」,臺北地方法院新聞稿(4/19/2024)。參考網址:https://tpd.judicial.gov.tw/tw/cp-2850-2454036-8938d-151.html。 [21] 可參考,「繁中資料量落後簡中 不利台AI語言模型」, 自由時報(11/5/2023)。參考網址:https://ec.ltn.com.tw/article/paper/1613748。 [22] 可參考,「日本大膽 all in AI!無論版權,官方允許任何資料訓練人工智慧」,Inside(6/2/2023)。參考網址:https://www.inside.com.tw/article/31820-Japan-AI-copyright。 |
|
( 時事評論|公共議題 ) |