![]() ![]() ![]() |
|
|
|
2025/01/31 10:42:04瀏覽1215|回應3|推薦16 | |
新春第一篇文章,首先祝各位朋友新年快樂、萬事如意、蛇年行大運! 近日負面新聞充斥於臺灣主流媒體的DeepSeek,中文名稱為深度求索,全稱杭州深度求索人工智慧基礎技術研究有限公司,是中華人民共和國的一家人工智慧與大型語言模型公司。該公司總部位於中國大陸浙江省杭州市,由中國大陸避險基金幻方量化創立,創始人和執行長為梁文鋒。 經查詢Deep Seek歷史沿革的相關資料,這家公司對於Deep Seek模型的開發,不是最近開始的,但我記得是一直到今年農曆春節連假開始後,Deep Seek才突然蹦出大量負面新聞,來源主要是美國及親美的臺灣、以色列,還有一些反中人士。 2023年10月28日,DeepSeek發表DeepSeek-Coder,這是深度求索的第一個大模型,11月29日,發布DeepSeek-LLM,12月15日,DeepSeek發表DreamCraft3D,是一個3D生成模型。 2024年1月11日,DeepSeek發布DeepSeek-MoE,效能超越Llama 2-7B,且計算量降低60%。 2024年2月5日,DeepSeek發布DeepSeekMath,DeepSeekMath 在競賽級MATH基準測試中取得了51.7%的優異成績,且未依賴外部工具包和投票技術,接近Gemini-Ultra和GPT-4的效能水平。 2024年3月11日,DeepSeek發布DeepSeek-VL。 2024年5月,DeepSeek發布並開源了旗下MoE大模型DeepSeek-V2,因其模型架構與經濟性而脫穎而出,DeepSeek-V2的API定價為每百萬tokens輸入1元、輸出2元,價格僅為GPT-4 Turbo的百分之一。 2024年6月17日,DeepSeek發布DeepSeek-Coder-V2,DeepSeek-Coder-V2在代碼特定任務中達到了與GPT4-Turbo相當的效能。 DeepSeek-Coder-V2在程式設計和數學基準測試中表現優異,超越了GPT4-Turbo、Claude 3 Opus和Gemini 1.5 Pro等模型。 2024年8月16日,DeepSeek同時發布DeepSeek-Prover-V1.5和DeepSeek-Prover-V1。 2024年9月5日,DeepSeek 宣布合併 DeepSeek Coder V2 和 DeepSeek V2 Chat 兩個模型,升級推出全新的 DeepSeek V2.5 新模型。 2024年11月20日,DeepSeek 發布 DeepSeek-R1-Lite,是深度求索第一個推理模型。 2024年12月13日,發布用於高級多模態理解的專家混合視覺語言模型——DeepSeek-VL2。同月26日,DeepSeek發布並開源了DeepSeek-V3,DeepSeek表示該大模型的訓練系基於2,048塊輝達H800型GPU(針對中國大陸市場的低配版GPU)叢集上執行55天完成,訓練耗資557.6萬美元;DeepSeek-V3的評測成績超越Qwen2.5-72B(阿里自研大模型)和LLaMA 3.1-405B(Meta自研大模型)等開源模型,能與GPT-4o、Claude 3.5-Sonnet(Anthropic自研大模型)等閉源模型相抗衡。 2025年1月20日, DeepSeek發布並開源了DeepSeek-R1模型,該模型在數學、代碼、自然語言推理等任務上,效能與OpenAI o1正式版相當;同月27日,DeepSeek智慧型助手在美區蘋果App Store下載榜上超越ChatGPT,並登頂App Store免費應用榜榜首,在這天,DeepSeek也發布多模態大模型Janus-Pro。 就我觀察,臺灣主流媒體也差不多就在上述歷史沿革中的1月20日Deep Seek-R1模型被開發出來,且該公司宣稱能以較低廉的成本開發出跟Open AI之Chat GPT一樣的模型,被美國媒體大量報導之後,Deep Seek各類負面新聞不斷,當中不乏人事時地物模糊不清的訊息。 根據渉谷(Tomatsu Shibutani)的論著【卽製消息-一個傳言的社會學研究】之觀點,Deep Seek之所以會有人事時地物模糊不清、真實性有待查證的傳言,是因為它是出自中華人民共和國的公司,而中華人民共和國近幾年被美國視為眼中釘,美國又一直自認且亟欲維持自己在國際、全球社會中的霸主地位,而臺灣、以色列都算是美國的側翼、棋子,而臺灣本身又有一股反中意識形態,加上Deep Seek目前有傷到輝達公司的股價,因此Deep Seek的舉措被認為締造出有問題的處境。 此外,相較於Deep Seek、或算是首要利害關係人的Open AI的內部人員來說,Deep Seek訊息的受眾比較無法從這兩家公司取得第一手消息,而臺灣主流媒體的從業人員也似乎不太能做到同樣的事,加上整體親綠、反中及親美的政治立場,相對較多仍以西方外電、美國企業界或財經界人士、美國官員的說法為消息來源,但美國企業界、財經界人士或官員對於Deep Seek的抨擊,也有可能是出於維護自家利益、國際社會之支配地位而做的。 不過,美國總統川普、Open AI的執行長,對Deep Seek倒都有過相對中立的評價。 其中,川普是在Deep Seek造成美國股災之時,表示低價但不低質的AI帶來的是積極的影響,因為這可以讓矽谷企業可以以更低的成本進行創新,而且DeepSeek給美國行業敲響警鐘,意味著美國企業需要全力以赴與中國企業進行競爭;OpenAI執行長薩姆·奧爾特曼則在今年1月27日表示,DeepSeek-R1是一款令人印象深刻的模型,尤其是考慮到它能夠以這個價格提供(這樣的產品)。 川普的發言,看來也有把Deep Seek視為對手的意思,而Open AI執行長的發言再對照該公司的指控行動,看來也是將Deep Seek視為對手,而再考量美國這陣子不斷有官員干預臺積電的企業運作、明顯展現把臺積電據為己有的野心,我認為目前Deep Seek的負面傳言也就主要是源自中美角力,加上美國不允許有威脅其國際社會支配地位的團體組織存在,而Open AI公司也急欲維持其人工智慧龍頭地位,因此都展開負面傳言散播行動,將Deep Seek貼上各種標籤。 至於臺灣主流媒體,除了基於美國傳聲筒、棋子之國際社會角色的行使,還有整體親綠、反中的政治立場之外,還有可能是基於Deep Seek傷到其視之為偶像的輝達公司的股價,結果是以往碰到社會案件,臺灣主流媒體對於受害人的指控常呼籲無罪推定,但這次Deep Seek爭議就不做此呼籲,而跟著美國佬一起散播傳言,做近似於社會學標籤理論之情境的有罪推定。 |
|
( 時事評論|公共議題 ) |