網路城邦
上一篇 回創作列表 下一篇   字體:
標籤理論看Deep Seek的集體溝通
2025/01/31 10:42:04瀏覽1215|回應3|推薦16

新春第一篇文章,首先祝各位朋友新年快樂、萬事如意、蛇年行大運!

近日負面新聞充斥於臺灣主流媒體的DeepSeek,中文名稱為深度求索,全稱杭州深度求索人工智慧基礎技術研究有限公司,是中華人民共和國的一家人工智慧與大型語言模型公司。該公司總部位於中國大陸浙江省杭州市,由中國大陸避險基金幻方量化創立,創始人和執行長為梁文鋒。

經查詢Deep Seek歷史沿革的相關資料,這家公司對於Deep Seek模型的開發,不是最近開始的,但我記得是一直到今年農曆春節連假開始後,Deep Seek才突然蹦出大量負面新聞,來源主要是美國及親美的臺灣、以色列,還有一些反中人士。

2023年10月28日,DeepSeek發表DeepSeek-Coder,這是深度求索的第一個大模型,11月29日,發布DeepSeek-LLM,12月15日,DeepSeek發表DreamCraft3D,是一個3D生成模型。

2024年1月11日,DeepSeek發布DeepSeek-MoE,效能超越Llama 2-7B,且計算量降低60%。

2024年2月5日,DeepSeek發布DeepSeekMath,DeepSeekMath 在競賽級MATH基準測試中取得了51.7%的優異成績,且未依賴外部工具包和投票技術,接近Gemini-Ultra和GPT-4的效能水平。

2024年3月11日,DeepSeek發布DeepSeek-VL。

2024年5月,DeepSeek發布並開源了旗下MoE大模型DeepSeek-V2,因其模型架構與經濟性而脫穎而出,DeepSeek-V2的API定價為每百萬tokens輸入1元、輸出2元,價格僅為GPT-4 Turbo的百分之一。

2024年6月17日,DeepSeek發布DeepSeek-Coder-V2,DeepSeek-Coder-V2在代碼特定任務中達到了與GPT4-Turbo相當的效能。 DeepSeek-Coder-V2在程式設計和數學基準測試中表現優異,超越了GPT4-Turbo、Claude 3 Opus和Gemini 1.5 Pro等模型。

2024年8月16日,DeepSeek同時發布DeepSeek-Prover-V1.5和DeepSeek-Prover-V1。

2024年9月5日,DeepSeek 宣布合併 DeepSeek Coder V2 和 DeepSeek V2 Chat 兩個模型,升級推出全新的 DeepSeek V2.5 新模型。

2024年11月20日,DeepSeek 發布 DeepSeek-R1-Lite,是深度求索第一個推理模型。

2024年12月13日,發布用於高級多模態理解的專家混合視覺語言模型——DeepSeek-VL2。同月26日,DeepSeek發布並開源了DeepSeek-V3,DeepSeek表示該大模型的訓練系基於2,048塊輝達H800型GPU(針對中國大陸市場的低配版GPU)叢集上執行55天完成,訓練耗資557.6萬美元;DeepSeek-V3的評測成績超越Qwen2.5-72B(阿里自研大模型)和LLaMA 3.1-405B(Meta自研大模型)等開源模型,能與GPT-4o、Claude 3.5-Sonnet(Anthropic自研大模型)等閉源模型相抗衡。

2025年1月20日, DeepSeek發布並開源了DeepSeek-R1模型,該模型在數學、代碼、自然語言推理等任務上,效能與OpenAI o1正式版相當;同月27日,DeepSeek智慧型助手在美區蘋果App Store下載榜上超越ChatGPT,並登頂App Store免費應用榜榜首,在這天,DeepSeek也發布多模態大模型Janus-Pro。

就我觀察,臺灣主流媒體也差不多就在上述歷史沿革中的1月20日Deep Seek-R1模型被開發出來,且該公司宣稱能以較低廉的成本開發出跟Open AI之Chat GPT一樣的模型,被美國媒體大量報導之後,Deep Seek各類負面新聞不斷,當中不乏人事時地物模糊不清的訊息。

根據渉谷(Tomatsu Shibutani)的論著【卽製消息-一個傳言的社會學研究】之觀點,Deep Seek之所以會有人事時地物模糊不清、真實性有待查證的傳言,是因為它是出自中華人民共和國的公司,而中華人民共和國近幾年被美國視為眼中釘,美國又一直自認且亟欲維持自己在國際、全球社會中的霸主地位,而臺灣、以色列都算是美國的側翼、棋子,而臺灣本身又有一股反中意識形態,加上Deep Seek目前有傷到輝達公司的股價,因此Deep Seek的舉措被認為締造出有問題的處境。

此外,相較於Deep Seek、或算是首要利害關係人的Open AI的內部人員來說,Deep Seek訊息的受眾比較無法從這兩家公司取得第一手消息,而臺灣主流媒體的從業人員也似乎不太能做到同樣的事,加上整體親綠、反中及親美的政治立場,相對較多仍以西方外電、美國企業界或財經界人士、美國官員的說法為消息來源,但美國企業界、財經界人士或官員對於Deep Seek的抨擊,也有可能是出於維護自家利益、國際社會之支配地位而做的。

不過,美國總統川普、Open AI的執行長,對Deep Seek倒都有過相對中立的評價。

其中,川普是在Deep Seek造成美國股災之時,表示低價但不低質的AI帶來的是積極的影響,因為這可以讓矽谷企業可以以更低的成本進行創新,而且DeepSeek給美國行業敲響警鐘,意味著美國企業需要全力以赴與中國企業進行競爭;OpenAI執行長薩姆·奧爾特曼則在今年1月27日表示,DeepSeek-R1是一款令人印象深刻的模型,尤其是考慮到它能夠以這個價格提供(這樣的產品)。

川普的發言,看來也有把Deep Seek視為對手的意思,而Open AI執行長的發言再對照該公司的指控行動,看來也是將Deep Seek視為對手,而再考量美國這陣子不斷有官員干預臺積電的企業運作、明顯展現把臺積電據為己有的野心,我認為目前Deep Seek的負面傳言也就主要是源自中美角力,加上美國不允許有威脅其國際社會支配地位的團體組織存在,而Open AI公司也急欲維持其人工智慧龍頭地位,因此都展開負面傳言散播行動,將Deep Seek貼上各種標籤。

至於臺灣主流媒體,除了基於美國傳聲筒、棋子之國際社會角色的行使,還有整體親綠、反中的政治立場之外,還有可能是基於Deep Seek傷到其視之為偶像的輝達公司的股價,結果是以往碰到社會案件,臺灣主流媒體對於受害人的指控常呼籲無罪推定,但這次Deep Seek爭議就不做此呼籲,而跟著美國佬一起散播傳言,做近似於社會學標籤理論之情境的有罪推定。

( 時事評論公共議題 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=blues1112a&aid=181723595

 回應文章

安歐門
等級:8
留言加入好友
2025/02/01 10:52

DeepSeek確實厲害,應該佩服該公司一票工程師的努力,

但是不可能打敗美國公司,無論哪一家,無論強弱,

台積電早已打敗所有美國公司,又如何?還不是乖乖投降,

美國牢牢控制著全球金融、軍事、科技,唯一打敗方法是戰爭,

問題是,誰能?誰敢?中共未來是有可能,現在還差遠,

有個10艘航空母艦再說吧!這只是舉例。

天蠍浪子(blues1112a) 於 2025-02-01 23:54 回覆:
美國在國際社會中的支配地位,難以撼動哪!

blackjack
等級:8
留言加入好友
2025/01/31 15:47

真正能夠不受偏見不預設立場沒有刻板印象對DEEPSEEK的評論,大概只剩chaptgpt之類的AI了好笑

天蠍浪子(blues1112a) 於 2025-02-01 00:19 回覆:
Chat GPT模型,依我個人經驗,它確實頗會迴避主觀評論。

上大人-川普在為美國延壽
等級:8
留言加入好友
就不要躲在被下幹架了
2025/01/31 14:11

美國想面子裡子都要﹐每出手時都先說是人家的錯﹐自己動手是對的﹐但當了解美國這次不再掩飾﹐全軍出動想一舉打垮令他們虧了千億的Deepseek﹐檯面各單位開始封禁使用﹐不久就會和Tiktok一樣的操作了。 而海外走狗亦相繼跟進﹐不是封禁就是指控抄襲﹔台狗們當然不落人後了。

以後中國還有很多的超越﹐你們都不用理由都通通給我禁﹗美國變成次等文明的世界﹐皆大歡喜了。 

天蠍浪子(blues1112a) 於 2025-02-01 00:18 回覆:

數位發展部現在也下令禁止公家機關用Deep Seek了呢!