TED Talk 的中文字幕:
人工智慧不只是被用來判定,我們想要買什麼產品,或是我們接下來想要看追哪齣劇。
我很好奇,對於這樣想的人, 你們有何感覺:
「黑人或拉丁裔的人,準時還清貸款的可能性 沒有白人高。」
「名字叫做約翰的人, 和名叫瑪莉的人相比,會是比較好的程式設計師。」
「比起白人,黑人比較 有可能會再次犯罪。」
你們可能在想:
「哇,那聽起來是性別主義 和種族主義的人會說的話」對吧?
上述這些是人工智慧 近期所做出的一些決策,
決策依據是它向我們學來的偏見,
向人類學來的。
--
2018年,當時她的時代背景,描述的是Netflix的推薦和Amazon的商品推薦,這些AI的領航者。
而後AI開始應用在信用評等或者是人士部門用來自動刪撿履歷表和工作申請書
她所描述的,是用演算法來決策產生的偏見。
--
2023年開始的LLM、大語言模型,讓「模型」成為另外一個戰場。這種偏見,影響將更為巨大。
經濟學人這篇文章《奧特曼被趕下台,揭示AI發展的哪些深層隱憂?》,約略提到:
由Open AI、Google等公司與350名AI科學家和科技業高管簽署的一份聲明,警告AI帶來的「滅絕風險」堪比核戰爭和流行病。儘管前景令人驚懼,支持這份聲明的公司都沒有暫停建立更強大的AI模型。
這些大語言模型,代表了人類的知識,其中也包括「認知」,但我們現在在談「認知作戰」講的是如何透過新聞、社群改變了大眾的認知。
未來這些大語言模型,會成為AI老師,我們的下一代,會直接間接從AI學習,事實上ChatGPT一出來,第一個受到衝擊的,就是網上的補教業,例如美國的Chegg。
Chegg 表示 ChatGPT 正在扼殺其業務,股價下跌超過 40%
大語言模型未來會走向,應該是以有一些Open Source的模型為基礎,然後各個應用再調適(Fine Tune)這些模型。這些Open Source的模型,用什麼文件資料(語料)來餵養出來,就很關鍵。
歐盟也關心自己是不是會失去對FAANG(Facebook, Amazon, Apple, Netflix, Google)的控制,法國新創公司推出的 Mistral Model,被歐盟認為是一個很好的發展。台灣或許可以朝這個方向努力,鼓勵自己的新創做出基於正體中文的語料做出的模型。
阿拉伯世界,也是在擔心這種話語權失落的問題
The worlds most advanced Arabic LLM is now available on open source
截至 2023 年 1 月,58.8% 的網路內容是英語,俄語則位居第二,僅佔 5.3%。阿拉伯文本僅佔萬維網內容的 0.9%。
我們就會發現沒有足夠的數據對於其他語言來說也是一個問題。” 「即使使用某種語言的人數非常多,網路上的文字量也可能很小。例如,西班牙語就是如此。有一個講西班牙語的大陸,但互聯網上的文本量相對較少。
「印地語和普通話也是如此,兩者都有數億使用者。儘管中國政府花費了大量的時間和金錢來解決這個問題,但仍然沒有足夠的普通話文本來滿足需要數據的人工智能演算法的需求。
台灣面對的,不只是FAANG,也要面對來自中國的社群媒體,抖音、小紅書,微信等平台。和 FAANG 合作,或許也也是台灣的策略之一。
一個自由開放的華文產業是台灣掌握華文話語權的方式,文化部以及新任副院長,任重道遠。