2C的ChatGPT對上2B的華為盤古大模型 - hallyeh部落格

字體：小中大

2C的ChatGPT對上2B的華為盤古大模型

2023/07/30 16:46:37瀏覽161｜回應0｜推薦3

7月24日美國國務卿布林肯和商務部長雷蒙多聯合撰文，內容是AI領域它需要一個完善的國際規則，…美國和七國集團可以作為“主導者”，制定這一領域的國際規則。明眼人都看得出，美國不好單幹，於是拉上七國集團背書，實際就是美國要成為AI領域的“規則製造者”，然而明白人都曉得AI領域目前就只有美國和中國大陸玩的開，其他國家頂多插插花罷了。

沒讓中國大陸參與AI國際規則的制定，只由美國主導制定，憑什麼，中國大陸的AI成就一點都不比美國差，未來誰先上還説不準呢。當下AI領域中美兩國伯仲之間，所以憑什麼AI國際規則要由你美國説了算。

不論行業何種，能夠掌握有用的資訊，那是對決策最大的用處，想一想一名優秀的醫生，經驗多了，腦子裡存儲的看病資料多了，自然對後來看病者更能對症下藥，不是嗎？這道理想你懂得的。

不論行業何種，個人的記憶畢竟有限，光靠同業交流，相互傳承還是有限，但現今這世界幾乎所有的信息都存放在機械或電子設備裡，簡單的例如個人電腦的硬碟裡，複雜點的儲存在如公司行號伺服器集中的硬碟裡，再複雜更多點的信息存在跨國公司的資料庫(Data Base)，而現在很多都儲存到雲端資料庫。

也稱數據的資料何用？簡單如醫生看病拿來對新病者做決策之用，也就是更精確對症下什麼藥。今天整個社會乃至全球有了更大數據(Big Data)存儲在各方，各行各業只要拿到關係自己的大數據做為基底，便能對該些數據進行探勘。資料探勘(Data Mining)的實際工作是對大規模資料進行自動或半自動分析，以提取過去未知的有價值的潛在資訊。

　　美國開啟了互聯網，積累的信息化數據完備，加以人工智能AI的軟硬體設備齊全，而且美國公司譬如Nvidia、AMD製造的GPU有足夠深入的計算能力，所以能夠做出很到位的聊天機器人可以想像的到。但是因為美國製造業空洞化的結果，於是相關製造業的各類別數據不完整，因此做不出像華為最近推出的盤古大模型，這種不只是以聊天方法開發應用的機器人，而是對產業界大大助益，可以幫助產業升級達到更具產能效益。

　　由於互聯網不論固定的或是移動的，都是在美國生成的，既有的先天軟硬體深層基礎，因而有各式軟體為它打造出被使用者習慣，不易被後來者取而代之的生態體系，例如微軟、谷歌、蘋果打造的生態體系幾十年來為他們收集到多少來自全球各地的資料。還有聊天型的Facebook、Instagram、YouTube等，電商的亞馬遜，網路設備商思科，數據庫的甲骨文、微軟SQL Server、MySQL、IBM DB2、等等不一而足的許許多多世界級公司，他們收集到全球的各種信息，全部送往美國，這些信息美國拿去做分析、統計、研究，其結果應用到哪裡，多的是不是你我能知道的，總之一定大大有用於他們。

美國可以不顧及他國他地區安全的資訊收集，反之要是他國做了，最明顯的便是中國大陸那些在美國知名的廠商，美國就是莫名的冠以國家安全為由，肆意大舉惡名這些廠商，強盜還搞雙重標準卻面不改色，真是壞。

　　美國成立的人工智能研究公司OpenAI，於2022年11月30日發佈研發的聊天機器人程式ChatGPT(Chat Generative Pre-trained Transformer)。ChatGPT是人工智慧技術驅動的自然語言處理工具，它能夠通過理解和學習人類的語言來進行對話，還能根據聊天的上下文進行互動，真正像人類一樣以聊天來交流，甚至能完成撰寫郵件、視頻腳本、文案、翻譯、代碼，以及寫論文等任務。

　　想想人，其他動物亦然，從不知到模仿、學習、試錯(Try Error)到認知，聊天機器人就是這樣的模式給做出來的，當然這過程少不了大量餵食聊天機器人各種數據(Data)。也許你可以回想一下，為何你明知是詐騙者的電話，你卻不經意透露給他更多的信息，這些新信息累積成的資料，或許便成了日後詐騙者更精確的與你聊天，或是與你提供相關係的友人聊天，在不知不覺中你還是上了詐騙者的當，或是你的友人被詐騙了。ChatGPT聊天機器人就是這樣的方法變得更加聰明。

且不説今年3月的一場發佈會上，Nvidia老闆黃仁勳相當貼切將ChatGPT形容成“iPhone時刻”，這個比喻是説初代iPhone的一些設計確實影響了日後的智慧手機，揭開了移動互聯網時代的序章，但初代iPhone更像個偏極客(Geek)風格的玩具，真正顛覆手機市場的，是後續的iPhone 3G等產品。

黃仁勳對於ChatGPT的形容，讓我們等著看後續ChatGPT的發展。

　　前段説了ChatGPT像人類一樣用來聊天交流，甚至能完成撰寫郵件、視頻腳本、文案、翻譯、代碼，及寫論文等任務，因為就是這等任務，所以我們稱ChatGPT是聊天機器人，它的對象明確是2C(To C)，即一般終端用戶(Client)。

　　其實在ChatGPT出世之前，資料探勘的研發已經多少應用在各個行業，美國不會不知道，只是現在的美國各門類已經不全，尤其是最可以發揮的製造業已經空洞化，即所謂“去實務虛”的結果，因此當華為的一篇氣象大模型論文登上自然(Nature)雜誌時，美國應該是五味雜陳的吧，因為這是針對2B(To B)，即企業用戶(Business)是也。

　　有不少年頭了，因為美國製造業空洞化，所以要做出類似華為的盤古大模型，似乎困難多多，相反中國大陸要做出像似ChatGPT之類的聊天機器人則容易的多了，因為中國大陸發達的互聯網一點都不遜美國，光靠自身的人口基數點滴積累的信息便不少，中國大陸投入在AI領域的人才不少，從而開發類比聊天機器人不是太難的事，現在差就差在硬體方面不能使用美國Nvidia公司生產的頂級GPU，這使得中國大陸在AI同樣的條件下，算力的速度可就慢了一二級。

　　中國大陸其實也有不錯的GPU，只是礙於情勢沒能得到台積電更好的代工製作，不過話説回來，就算沒有頂級的GPU加持，但另走軟體途徑也是可以，正所謂劍走偏鋒得咧，不就是利用數學來解唄，計算能力方面，中國大陸多的是人才，數學家也多，不像美國，要不是有著其他國家的在美工程師助力，恐怕難以成事。

　　ChatGPT推出之後，世界各國有能力的也都可以跟著上，但不同的是，也只能中國大陸的相關企業有本事跟上，一方面是中國大陸有足夠的人口基數造就大數據(Big Data)，另一方面中國大陸政府在AI領域的使力使然，因而有了多多AI領域的人才。

　　對於智能機器人，中美兩國好像在PK，意思是你有我也得有，但是再琢磨可以明白美國製的對象是一般終端用戶(Client)，所以大概稱它是聊天機器人，而華為開發出來的則是針對企業用戶(Business)，明顯中美兩國做出來的不同，然而用於企業的大模型還是會用到類似ChatGPT這種通用大模型。

　　當一家公司行號面臨轉型升級之際，顯然自己內部的數據已經不能滿足改造，於是必須借助外力來突破、來改變，外力就是不同己身卻具備更加有用、利己的數據。華為做為代表研發的企業用大模型便是這種理念的產物。

　　正如上段所説工業場景下的資料並不如互聯網那麼豐富。大模型技術固然先進，但需要海量資料作為支撐，然而本身體量的工業資料，又未必能支撐起一個大模型，因此，華為雲利用了類似ChatGPT的通用大模型，讓它額外去學習一些行業的資料，打造一個行業大模型。

　　由於通用大模型已經具備較強的通用能力，於是接下來的大模型層級以解決工業場景下的具體工作，最後還設計了一個完整的回饋鏈條，通過記錄各行業的處理日誌等資料，反哺到通用大模型訓練資料語料中，進而不斷提升其智慧。中國大陸有著世界唯有的全門類製造業，因此打造To Business的大模型應該是全球目前能夠辦得到的國家吧。

不管2C或2B，這類人工智能就是對收集到的信息的發揮作用。人的大腦是收集信息的儲存所，但是畢竟有限，更無法擴大，而人工智能收集到的信息則是儲存在所謂的資料庫(Data Base)，它的儲存體目前如機械式硬碟或固態硬碟，小則如記憶卡、DRAM之類。現今儲存體的擴展可以是大小伺服器或是雲端，而這又是中國大陸遭到美國拿捏住的弱處。

當中國大陸實施對鎵、鍺出口管制之際，拜登政府又祭上不准中國大陸使用谷哥雲、微軟雲、亞馬遜雲、…等等美國雲，雲端是AI少不了的環節，雖然中國大陸也有自己的雲，例如阿里雲、華為雲、騰訊雲、百度雲、…等，但是許多硬體設備、元件被美國卡住啊。

美國可以憑藉互聯網的利基收集到全球各地的資訊，有了這麼大的數據庫，對於AI的應用研發大大有所助益，所以説美國能率先推出ChatGPT這種程式不足為奇，然而中國大陸在互聯網領域的成就，一點都不遜於美國，除了中國大陸本身的理工科人才多多之外，中國大陸的眾多人口紅利，也使得中國大陸有了足夠多的數據信息，所以相關於AI領域的研發與美國是你來我往，可以伯仲，説到算力，中國大陸有的是數學家，就這一點美國可是力有未逮夠他吃一壺。

至今美國依然掌握著深層基礎軟體、數據庫軟體以及CPU、GPU高階晶片，中國大陸的AI成就雖然不小，但是時時得面臨著美國的掣肘、使絆子，的確難過的呀，怎麼樣站住自己的腳跟，真是漫漫長夜路遙遙呀，總之路還是得往前大步走，慢慢熬，等黎明到來吧。

應用在各行各業的AI大模型更是需要用到移動互聯網，現今已到5G時代，這是中國大陸的獨家強項，美國真跟不上啦，在往後的6G以致XG到來，我看美國的AI研發進展可能會不知怎麼辦。

Hallyeh 2023/7/28

( 時事評論｜國際 )