標籤理論看Deep Seek的集體溝通 - 天蠍浪子的咖啡杯

字體：小中大

標籤理論看Deep Seek的集體溝通

2025/01/31 10:42:04瀏覽1215｜回應3｜推薦16

新春第一篇文章，首先祝各位朋友新年快樂、萬事如意、蛇年行大運！

近日負面新聞充斥於臺灣主流媒體的DeepSeek，中文名稱為深度求索，全稱杭州深度求索人工智慧基礎技術研究有限公司，是中華人民共和國的一家人工智慧與大型語言模型公司。該公司總部位於中國大陸浙江省杭州市，由中國大陸避險基金幻方量化創立，創始人和執行長為梁文鋒。

經查詢Deep Seek歷史沿革的相關資料，這家公司對於Deep Seek模型的開發，不是最近開始的，但我記得是一直到今年農曆春節連假開始後，Deep Seek才突然蹦出大量負面新聞，來源主要是美國及親美的臺灣、以色列，還有一些反中人士。

2023年10月28日，DeepSeek發表DeepSeek-Coder，這是深度求索的第一個大模型，11月29日，發布DeepSeek-LLM，12月15日，DeepSeek發表DreamCraft3D，是一個3D生成模型。

2024年1月11日，DeepSeek發布DeepSeek-MoE，效能超越Llama 2-7B，且計算量降低60%。

2024年2月5日，DeepSeek發布DeepSeekMath，DeepSeekMath 在競賽級MATH基準測試中取得了51.7%的優異成績，且未依賴外部工具包和投票技術，接近Gemini-Ultra和GPT-4的效能水平。

2024年3月11日，DeepSeek發布DeepSeek-VL。

2024年5月，DeepSeek發布並開源了旗下MoE大模型DeepSeek-V2，因其模型架構與經濟性而脫穎而出，DeepSeek-V2的API定價為每百萬tokens輸入1元、輸出2元，價格僅為GPT-4 Turbo的百分之一。

2024年6月17日，DeepSeek發布DeepSeek-Coder-V2，DeepSeek-Coder-V2在代碼特定任務中達到了與GPT4-Turbo相當的效能。 DeepSeek-Coder-V2在程式設計和數學基準測試中表現優異，超越了GPT4-Turbo、Claude 3 Opus和Gemini 1.5 Pro等模型。

2024年8月16日，DeepSeek同時發布DeepSeek-Prover-V1.5和DeepSeek-Prover-V1。

2024年9月5日，DeepSeek 宣布合併 DeepSeek Coder V2 和 DeepSeek V2 Chat 兩個模型，升級推出全新的 DeepSeek V2.5 新模型。

2024年11月20日，DeepSeek 發布 DeepSeek-R1-Lite，是深度求索第一個推理模型。

2024年12月13日，發布用於高級多模態理解的專家混合視覺語言模型——DeepSeek-VL2。同月26日，DeepSeek發布並開源了DeepSeek-V3，DeepSeek表示該大模型的訓練系基於2,048塊輝達H800型GPU（針對中國大陸市場的低配版GPU）叢集上執行55天完成，訓練耗資557.6萬美元；DeepSeek-V3的評測成績超越Qwen2.5-72B（阿里自研大模型）和LLaMA 3.1-405B（Meta自研大模型）等開源模型，能與GPT-4o、Claude 3.5-Sonnet（Anthropic自研大模型）等閉源模型相抗衡。

2025年1月20日， DeepSeek發布並開源了DeepSeek-R1模型，該模型在數學、代碼、自然語言推理等任務上，效能與OpenAI o1正式版相當；同月27日，DeepSeek智慧型助手在美區蘋果App Store下載榜上超越ChatGPT，並登頂App Store免費應用榜榜首，在這天，DeepSeek也發布多模態大模型Janus-Pro。

就我觀察，臺灣主流媒體也差不多就在上述歷史沿革中的1月20日Deep Seek-R1模型被開發出來，且該公司宣稱能以較低廉的成本開發出跟Open AI之Chat GPT一樣的模型，被美國媒體大量報導之後，Deep Seek各類負面新聞不斷，當中不乏人事時地物模糊不清的訊息。

根據渉谷(Tomatsu Shibutani)的論著【卽製消息-一個傳言的社會學研究】之觀點，Deep Seek之所以會有人事時地物模糊不清、真實性有待查證的傳言，是因為它是出自中華人民共和國的公司，而中華人民共和國近幾年被美國視為眼中釘，美國又一直自認且亟欲維持自己在國際、全球社會中的霸主地位，而臺灣、以色列都算是美國的側翼、棋子，而臺灣本身又有一股反中意識形態，加上Deep Seek目前有傷到輝達公司的股價，因此Deep Seek的舉措被認為締造出有問題的處境。

此外，相較於Deep Seek、或算是首要利害關係人的Open AI的內部人員來說，Deep Seek訊息的受眾比較無法從這兩家公司取得第一手消息，而臺灣主流媒體的從業人員也似乎不太能做到同樣的事，加上整體親綠、反中及親美的政治立場，相對較多仍以西方外電、美國企業界或財經界人士、美國官員的說法為消息來源，但美國企業界、財經界人士或官員對於Deep Seek的抨擊，也有可能是出於維護自家利益、國際社會之支配地位而做的。

不過，美國總統川普、Open AI的執行長，對Deep Seek倒都有過相對中立的評價。

其中，川普是在Deep Seek造成美國股災之時，表示低價但不低質的AI帶來的是積極的影響，因為這可以讓矽谷企業可以以更低的成本進行創新，而且DeepSeek給美國行業敲響警鐘，意味著美國企業需要全力以赴與中國企業進行競爭；OpenAI執行長薩姆·奧爾特曼則在今年1月27日表示，DeepSeek-R1是一款令人印象深刻的模型，尤其是考慮到它能夠以這個價格提供（這樣的產品）。

川普的發言，看來也有把Deep Seek視為對手的意思，而Open AI執行長的發言再對照該公司的指控行動，看來也是將Deep Seek視為對手，而再考量美國這陣子不斷有官員干預臺積電的企業運作、明顯展現把臺積電據為己有的野心，我認為目前Deep Seek的負面傳言也就主要是源自中美角力，加上美國不允許有威脅其國際社會支配地位的團體組織存在，而Open AI公司也急欲維持其人工智慧龍頭地位，因此都展開負面傳言散播行動，將Deep Seek貼上各種標籤。

至於臺灣主流媒體，除了基於美國傳聲筒、棋子之國際社會角色的行使，還有整體親綠、反中的政治立場之外，還有可能是基於Deep Seek傷到其視之為偶像的輝達公司的股價，結果是以往碰到社會案件，臺灣主流媒體對於受害人的指控常呼籲無罪推定，但這次Deep Seek爭議就不做此呼籲，而跟著美國佬一起散播傳言，做近似於社會學標籤理論之情境的有罪推定。

( 時事評論｜公共議題 )

哇新聞	城市
最新討論	最新文章
熱門討論	最新推薦
相簿	部落格
最新相片	最新文章
最新推薦	最新推薦


	回應文章