

隨著 AI、雲端運算、資料中心等應用快速成長,背後有一個關鍵技術正在悄悄改變世界——那就是「高頻寬記憶體」(HBM, High Bandwidth Memory)。2025 年,HBM 這塊市場由 SK 海力士、三星、美光三大巨頭主導,彼此之間的競爭越來越激烈。這篇文章會用最白話的方式,帶你認識 HBM 到底是什麼、為什麼重要、最新的技術發展,以及三大廠各自的優勢與現況。
HBM是種可以用於高速運算、能運送大量資料的記憶體,且它比普通的動態隨機存取記憶體(dynamic random-access memory, DRAM)的容量更大,還能更快速的存取記憶體,讓資料能夠輕易的傳送與儲存,適用於AI伺服器、自駕車市場、高效能運算和高速網路設備等領域。若以構造來看,HBM應用了3D堆疊封裝技術將多個DRAM晶粒垂直堆疊,並以矽穿孔(Through-Silicon Via, TSV)相連,不僅提升記憶體的頻寬,也減少了過去有關功耗和體積空間的問題。
一般我們熟悉的記憶體,主要是讓處理器(CPU、GPU)暫時存放資料,方便快速運算。隨著 AI、繪圖、超級電腦等需求越來越大,傳統記憶體已經快跟不上速度,這時候 HBM 就登場了。
HBM 最大的特色有三點:
速度超快:傳統記憶體像是高速公路,HBM 則像是多線道的高鐵,每秒能傳輸的資料量(頻寬)是傳統記憶體的好幾倍。
省空間又省電:HBM 把記憶體一層一層往上堆(3D 堆疊),不像過去橫向排一排,這樣不但節省空間,也讓資料傳輸距離變短,耗電更低。
專為 AI、超級電腦設計:HBM 幾乎是 AI 晶片、資料中心、超級電腦等高階產品的標配,因為這些應用需要大量、即時的資料處理。
HBM 也有分不同世代,越新一代的 HBM,速度越快、容量越大、耗電越低。這幾年討論度最高的是 HBM3E 和 HBM4。
HBM3E
HBM4
最新一代,2025 年開始逐漸導入,未來會是主流。
容量更大(最高 64GB)、速度更快(頻寬最高 2TB/s),還能支援更多層的堆疊(最多 16 層)。
為了讓這麼多層的記憶體穩定又快速地運作,背後的製程和封裝技術也大幅升級。
HBM 為什麼這麼厲害?關鍵就在於它的「製程技術」和「封裝方式」。這裡用白話來解釋:
1. 3D 堆疊+矽穿孔(TSV)
傳統記憶體像一層樓的平房,HBM 則像高樓大廈,把記憶體一層一層往上堆,最多可以堆到 12 層、16 層。
這些層之間要怎麼連接?就是靠「矽穿孔」(TSV),簡單說就是在晶片上打很多小孔,然後用金屬把每一層的電路接起來,讓資料可以像坐電梯一樣快速上下傳遞。
2. 先進封裝技術
要把這麼多層的晶片堆在一起,還要讓它們不會過熱、訊號不會亂掉,封裝技術就變得超級重要。三大廠各有獨門絕活:
SK 海力士:用的是 MR-MUF 技術(簡單說就是把晶片堆好後,一次用高導熱的材料把縫隙填滿,既能固定又能散熱),這招讓他們可以穩定量產 12 層、甚至未來 16 層的 HBM。
美光:主打 TC-NCF 技術(用膠膜熱壓固定),好處是彈性高,但要堆到很多層時,良率會比較辛苦,所以目前主力還是在 8 層、12 層。
三星:則是積極提升高層堆疊的良率,並且導入更多自家優化的先進封裝技術,力拼追趕。
未來 HBM4 會用到「Hybrid Bonding」(混合鍵合),這種技術讓晶片之間的連接更緊密,速度更快、耗電更低,會是下一波競爭重點。
3. 晶片製程升級
HBM4 的基礎晶片(Base Die)會用到台積電 12 奈米、甚至 5 奈米製程,這代表晶片更小、連線更密、速度更快。
台積電的 CoWoS-L/R 等先進封裝技術,讓 HBM4 可以和 AI 晶片搭配得更好,資料傳輸路徑更短、效能更高。

SK 海力士
SK海力士半導體公司(SK Hynix Semiconductor Inc.,諺文:SK하이닉스,韓交所:000660)是一家韓國主要的電子公司,海力士是僅次於三星電子的全球第二大記憶體晶片製造商,也是全球第六大半導體公司以及全球二十大半導體廠商之一。海力士於1983年以現代電子產業有限公司的名字創立。在80及90年代 他們專注於銷售DRAM,後來是SDRAM。2001年他們以6億5000萬美元的價格出售。
目前是 HBM 市場的「一哥」,市佔率超過一半,特別是在 HBM3E 這一代幾乎壟斷。
技術和產能都很穩定,NVIDIA、AMD 等大廠都指定其 HBM。與台積電合作密切,HBM4 也預計會搶先量產。
近期值得注意的是,過去 SK 海力士長期為 AMD HBM 主要供應商,但這次 MI350、MI400 系列選擇三星與美光,顯示 AMD 在供應鏈策略上做了重大調整,可能與產品相容性、產能、成本或技術合作有關。
三星
市佔率約三成多,過去是記憶體霸主,但 HBM3E 這一代一度落後。
這兩年積極擴大產能、提升良率,搶回不少訂單,三星此次突破過去在 HBM 良率與認證上的瓶頸,成功取得 AMD 大單,被視為產業一大里程碑。
也在加速 HBM4 的技術研發,希望能扳回一城。
美光
市佔率約兩成多,這幾年成長最快。
主打低功耗、高效能的製程優勢,搶下不少 NVIDIA 的 HBM3E 訂單。
積極擴增日本、台中等產線,未來 HBM4 也會加入戰局。
AI、資料中心需求爆炸:AI 晶片、雲端伺服器、超級電腦都需要大量、即時的資料處理,HBM 是唯一能滿足這些需求的記憶體。
技術門檻超高:HBM 的製程和封裝難度很高,良率只有 50~60%,不是隨便一家公司就能做。
三雄壟斷,產能搶很兇:目前只有 SK 海力士、三星、美光三家能穩定量產,產能和技術誰領先,誰就能拿下大單。
未來競爭會更激烈:HBM4 將結合更多先進封裝、製程,三大廠不只要拼技術,還要拼產能、拼良率,誰能做得多、做得好,誰就能主導市場。
HBM 就像是 AI 世界的「超級高速公路」,讓資料能以驚人的速度在晶片之間流動,推動 AI、超級電腦、雲端運算等產業快速成長。2025 年,SK 海力士、三星、美光三雄各有優勢,彼此競爭激烈。隨著 HBM4、Hybrid Bonding 等新技術問世,這場記憶體大戰才正要進入高潮。
責任編輯:Sisley
核稿編輯:Chris
最後更新日期:2025年7月4日
當我們談到 AI 運算,許多人第一個想到的就是「顯示卡要夠力」。但 CPU(中央處理器)與 GPU(圖形處理器)究竟差在哪?為什麼 GPU 在 AI 領域能稱霸?底下這張表格讓你一目了然。
| 特性 | CPU (中央處理器) | GPU (圖形處理器) |
|---|---|---|
| 核心架構 | 少量、強大的核心 (數個 ~ 數十個) | 大量、簡單的核心 (數千個以上) |
| 擅長任務 | 複雜、多樣的循序任務 (如作業系統、應用程式邏輯) | 單純、重複性高的大規模並行任務 (如圖形渲染、AI 運算) |
| 運作比喻 | 一位經驗豐富、能處理各種疑難雜症的總指揮官 | 一支紀律嚴明、能同時執行單一命令的萬人軍隊 |
| AI 應用角色 | 資料預處理、流程控制、系統管理 | 模型訓練、AI 繪圖、大型語言模型推理 (核心) |
| 關鍵指標 | 時脈速度、IPC (每時脈週期指令數)、快取大小 | VRAM 容量、Tensor 核心數、記憶體頻寬 |
簡單來說,CPU 是通才,什麼都會但不是樣樣頂尖;而 GPU 則是專為大規模平行運算而生的專才,這恰好完美契合了 AI 演算法的需求。
想像一下,CPU 就像一位米其林三星大廚,他能獨立完成從備料、切菜、烹炒到擺盤的所有複雜工序。他能處理各種突發狀況,每個步驟都精雕細琢。這就是「循序處理」,非常適合執行像作業系統、瀏覽網頁、玩策略遊戲這種需要複雜邏輯判斷的任務。
然而,如果要他同時炸一萬份薯條,這位大廚就算有三頭六臂也會崩潰,因為他一次只能專心處理一兩件事。
現在換成 GPU,它就像一支由上萬名士兵組成的軍隊。他們每個人只會一個簡單的指令:「開火」。當指揮官一聲令下,上萬支步槍同時開火,瞬間形成強大的火力網。這就是「平行處理」。
AI 的核心運算,如神經網路的訓練,本質上就是進行數百萬次甚至數十億次的簡單數學計算(矩陣乘法)。這種任務交給 CPU 來做,就像叫大廚去炸薯條;而交給 GPU,正是讓每個小核心(士兵)處理一小部分計算,一瞬間就能完成,效率天差地遠。這也是為何在 AI 領域,GPU 成為了不可或缺的硬體。
了解 GPU 擅長平行運算後,我們來深入看看它稱霸 AI 的三大武器。在挑選 AI 用途的顯示卡時,這三點是玩家最需要關注的重點。
CUDA 是由 NVIDIA 開發的平行運算平台與編程模型。它讓開發者可以輕易地使用 C++ 等語言,直接利用 NVIDIA GPU 的強大算力。經過十多年的發展,CUDA 已經成為 AI 和深度學習領域的業界標準。絕大多數的 AI 框架(如 TensorFlow, PyTorch)都基於 CUDA 打造。這意味著選擇 NVIDIA GPU,你就能擁有最豐富的資源、最好的相容性和最強的社群支援。想了解更多顯卡挑選細節?可以參考這篇 顯示卡怎麼挑?5 分鐘教你看懂 2025 顯卡型號與規格!
從 RTX 系列開始,NVIDIA 在 GPU 中加入了名為「Tensor Core」的特殊單元。這就像是在 GPU 這支大軍中,又額外配置了專門用於矩陣運算的重砲部隊。每一代 Tensor Core 都會持續進化,讓 AI 訓練和推理的速度倍增。這也是為什麼 RTX 系列顯示卡在 AI 應用上遠勝於舊款的 GTX 系列。
VRAM 是 GPU 專用的高速記憶體。在執行 AI 任務時,整個 AI 模型和相關數據都需要先載入 VRAM。VRAM 的大小,直接決定了你能跑多大的 AI 模型,以及能生成多高解析度的圖片。如果 VRAM 不夠,系統就會頻繁與速度慢得多的主記憶體交換資料,效能將會斷崖式下跌。對於 AI 運算來說,VRAM 容量是絕對的硬指標,甚至比 GPU 核心時脈更重要。
雖然 GPU 在 AI 運算中扮演主角,但 CPU 的角色同樣關鍵,它就像是整台電腦的「大腦」與「後勤總管」。如果沒有一顆稱職的 CPU,再強的 GPU 也無法發揮全力。
因此,一個理想的 AI 工作站,需要的是 CPU 與 GPU 之間的平衡。不需要追求最頂級的 CPU,但一顆性能穩定的中高階 CPU 是確保整個 AI 工作流程順暢的基礎。對於想組裝新機的朋友,可以參考這份 Core Ultra 與 Ryzen 9000 全系列規格表與選購懶人包,挑選最適合你的 CPU。若需要專業的電腦組裝服務,小唐電腦 永遠是您可靠的夥伴。
隨著 NVIDIA Blackwell 架構的 RTX 50 系列陸續在 2025 年登場,AI 運算的效能迎來了新的紀元。新一代 GPU 全面採用速度更快的 GDDR7 記憶體,並搭載了效能更強的第五代 Tensor Core,為 AI 玩家提供了前所未有的算力。這裡 小唐電腦 根據最新洩漏與已發布的資訊,提供最前線的挑選建議,避免玩家花冤枉錢。
注意: 此為洩漏與傳聞資訊整理,基於 2025 年初市場資訊,僅供參考,非官方最終數據。
| 顯示卡型號 | 預計 GPU 晶片 | 傳聞 VRAM 容量 | 記憶體介面 | 上市時間 |
|---|---|---|---|---|
| RTX 5060 | GB206 | 8GB GDDR7 | 128-bit | 2025 年 5月20日 |
| RTX 5060 Ti | GB205 | 8GB / 16GB GDDR7 | 128-bit | 2025 年 4月16日 |
| RTX 5070 | GB205 | 12GB GDDR7 | 256-bit | 2025 年 3月 5日 |
| RTX 5070 Ti | GB203 | 16GB GDDR7 | 256-bit | 2025 年 2月20日 |
| RTX 5080 | GB203 | 32GB GDDR7 | 256-bit | 2025 年 1月30日 |
| RTX 5090 | GB202 | 32GB GDDR7 | 512-bit | 2025 年 1月30日 |
A:雖然 AMD GPU 的原始運算能力很強,但在目前的 AI 生態系中,NVIDIA 憑藉其 CUDA 平台佔據了絕對優勢。絕大多數主流的 AI 框架、模型和教學資源都基於 CUDA 開發,這意味著用 NVIDIA GPU(尤其是 RTX 系列)會有最好的相容性和最少的麻煩。對於初學者和絕大多數使用者來說,選擇 NVIDIA 是最穩妥、最高效的路線。AMD 的 ROCm 平台雖然在進步,但社群支援和成熟度仍有差距。
A:VRAM 極度重要,甚至比核心速度更關鍵!AI 模型(特別是大型語言模型或高解析度繪圖模型)需要被完整載入到 VRAM 中才能高效運作。如果 VRAM 不足,系統就必須使用速度慢幾十倍的系統記憶體 (RAM) 或硬碟,導致效能暴跌甚至無法執行。簡單來說,VRAM 容量決定了你能「跑多大」的模型,而 GPU 核心速度決定了你「跑多快」。對於 AI 應用,VRAM 是越大越好。
A:可以,但有前提。AI 運算主要負載在 GPU 上,所以升級一張強力的 GPU 會帶來最顯著的提升。但如果 CPU 過於老舊(例如 5 年前的入門款),它可能會成為數據傳輸的瓶頸,無法即時地「餵飽」GPU 所需的資料,從而限制 GPU 的全部效能。建議至少搭配一顆中階的現代 CPU(如 Intel Core i5 或 AMD Ryzen 7 的近期代數),才能確保整體系統的平衡。若預算有限,進行電腦主機升級時,優先投資 GPU 是正確的方向。
A:第五代 Tensor Core 是 NVIDIA 在 RTX 50 Blackwell 架構中內建的 AI 運算專用硬體。相比前代,它對新的數據格式(如 FP8 和 FP6)提供了更高效的支援,這意味著在執行 AI 推理和訓練時能達到更高的吞吐量和更低的延遲。簡單來說,它讓同樣的 AI 運算能跑得更快、更省電。因此,對於嚴肅的 AI 玩家來說,選擇搭載最新 Tensor Core 的 RTX 50 系列顯示卡,會帶來顯著的效能飛躍。
A:完全不需要!RTX 5090 是為專業開發者和追求極致效能的用戶準備的。對於最新、要求更高的 Stable Diffusion 3 模型,一張擁有 12GB GDDR7 VRAM 的 RTX 5060 就已經能提供流暢的體驗。如果預算充裕,選擇擁有 16GB VRAM 的 RTX 5060 Ti 或 RTX 5070,將讓你在處理更高解析度輸出和複雜工作流時更有餘裕,是 CP 值非常高的選擇。有任何電腦組裝問題,隨時可以諮詢 小唐電腦。
A:NPU(神經網路處理單元)是專為輕量級、持續性的 AI 任務設計的,例如 Windows 的 Studio Effects 視訊鏡頭效果、即時語音降噪等。它的優點是極度省電。但對於需要強大算力的 AI 訓練或高階推理(如 AI 繪圖、大型模型運算),NPU 的算力遠遠不及獨立 GPU。因此,NPU 和 GPU 是互補關係,而非取代關係。NPU 負責低功耗的系統級 AI 應用,而重度 AI 運算仍需依賴強大的 GPU。
A:是的,高階 GPU 在全速進行 AI 運算時非常耗電。根據傳聞,RTX 50 系列雖然採用了更先進的製程,但為了追求極致效能,高階型號(如 RTX 5080、5090)的功耗 (TGP) 依然不容小覷。因此,在進行桌機升級、加裝強力 GPU 時,務必確認您的電源供應器瓦數是否足夠,並強烈建議使用符合 ATX 3.0 與 PCIe 5.0 電源供應器解析規範的電源,以確保穩定供電。
A:除了 CPU 和 GPU,以下幾點也很重要:1. 記憶體 (RAM):建議至少 32GB DDR5,如果需要同時處理大型資料集,64GB 更佳。想了解更多可參考記憶體升級你搞懂了嗎?DDR4、DDR5 差在哪?。2. 儲存 (SSD):使用高速的 PCIe 4.0 或 5.0 NVMe SSD 來存放模型、資料集和作業系統,可以大幅縮短讀取時間。3. 散熱:GPU 在 AI 運算時會產生大量熱能,良好的機殼風道和散熱器是維持系統穩定、避免降頻的關鍵。
A:根據過往經驗和近期傳聞,NVIDIA 很可能會在 RTX 50 系列發布後 6-12 個月推出 SUPER 型號,通常會提供「加量不加價」的升級,例如增加 VRAM 容量或小幅提升核心數。如果您的升級需求不急迫,且希望獲得最高的性價比,等待 SUPER 系列發布確實是一個可行的策略。但如果您有即時的效能需求,或是現有硬體已無法滿足工作,那麼直接購入首發的 RTX 50 系列將能立即享受次世代的效能提升。
A:AI 運算對硬體要求高,問題可能源於驅動程式、軟體設定、硬體過熱或供電不穩。您可以先嘗試更新 NVIDIA 驅動程式到最新版。如果問題持續,很可能是硬體配置或穩定性問題。這時尋求專業的電腦維修服務是最好的選擇。小唐電腦 提供專業的硬體檢測與 AI 主機優化服務,能幫您快速找出問題根源,從系統安裝到硬體除錯,一手包辦。
總結來說,「CPU vs. GPU」在 AI 領域並不是一場對決,而是一場團隊合作。CPU 是運籌帷幄的指揮官,而 GPU 則是衝鋒陷陣的超級王牌。想要踏入 AI 的奇妙世界,投資一張強大的 NVIDIA RTX GPU 無疑是關鍵的第一步,它將直接決定你的 AI 體驗與產出效率。
從 AI 繪圖到程式開發,硬體的穩定性與匹配性至關重要。如果您對於如何進行電腦組裝、升級,或是對於筆電重灌有任何疑問,都歡迎隨時聯繫 小唐電腦。我們擁有豐富的經驗,能為您打造最適合您需求的 AI 運算主機。
什麼是CoWoS-S、CoWoS-R、CoWoS-L?這些差在哪? - stockmasters blog - udn部落格
「記憶體與基本儲存電路:Latch & Flip Flop」 - iT 邦幫忙::一起幫忙解決難題,拯救 IT 人的一天