採購評比

Threadripper vs EPYC vs Ryzen:2026 AI 工作站 CPU 平台選購評比

2026-06-16 | 約 9 分鐘 | MAQ 技術團隊

2026 年要在自家機房或研究室組一台 AI 工作站,GPU 通常是大家第一個盯著看的零件,但真正決定「這台機器能不能擴張、能不能上多卡、能不能餵飽 GPU」的,其實是底層的 CPU 平台。同樣是 AMD,Ryzen 9、Threadripper/Threadripper PRO、EPYC 是三條完全不同的產品線,差別不在跑分高低,而在 PCIe 通道數、記憶體通道與容量、ECC 支援、以及能掛幾張顯卡。選錯平台,再貴的 GPU 也會被卡在通道與頻寬瓶頸上。

這篇評比會用工程角度把三個平台拆開講清楚:誰適合單卡推論、誰適合多卡微調、誰才撐得起全精度訓練與超大記憶體模擬,最後對照 MAQ 對應的實機選型,讓你讀完直接知道該下哪一台。

先講結論:CPU 平台決定的不是速度,是「擴張天花板」

對 AI 工作負載來說,CPU 本身很少是瓶頸——瓶頸幾乎都來自 GPU 餵不飽顯卡掛不上去。所以選平台要看四件事:

  • PCIe 5.0 通道數:每張高階 GPU 想吃滿 x16,多卡時通道夠不夠分。
  • 記憶體通道與容量:資料前處理、向量庫、KV cache 溢位、CPU offload 都吃系統記憶體頻寬。
  • ECC:長時間訓練/推論要避免位元翻轉造成的隱性錯誤。
  • 多卡並聯能力:能不能原生掛 4–7 張卡、每張都有充足通道。
GPU 決定「模型跑不跑得動」,CPU 平台決定「你能把這套架構擴張到多大」。

三大平台規格對照(2026)

下表整理 2026 年三條產品線的關鍵差異。數字以 Zen 5 世代(Ryzen 9000、Threadripper 9000/PRO 9000WX、EPYC 9005「Turin」)為準:

項目 Ryzen 9(X870E / AM5) Threadripper(TRX50) Threadripper PRO(WRX90) EPYC(伺服器級)
代表型號 9950X3D / 9900X3D 9960X(24核) 9975WX(32核)/ 9995WX(96核) 9005 Turin(最高 192核)
PCIe 5.0 通道 約 24 條可用 約 80 條可用(含晶片組通道可更高) 128 條 128 條(單路)/ 160 條(雙路)
記憶體通道 2(雙通道) 4 8(ECC RDIMM) 12(ECC RDIMM)
記憶體容量上限 約 192GB UDIMM 數百 GB 到 1TB+ 等級 每路最高 6TB
ECC 需主機板支援(UDIMM) 支援 RDIMM ECC 原生 RDIMM ECC 原生 RDIMM ECC
實際多卡上限 1 卡為主(第 2 卡降速) 2–3 卡 4–7 卡 視主機板,可多卡
定位 主流 / 性價比 高階桌面(HEDT) 專業工作站 資料中心 / 伺服器

一眼就能看出分水嶺:Ryzen 9 只有約 24 條 PCIe 5.0 與雙通道記憶體,掛單卡綽綽有餘,但第二張卡就要跟主機板搶通道、通常降到 x8/x4;Threadripper 9960X 跳到約 80 條可用 PCIe 5.0 與 4 通道(實際條數依主機板與計入方式而異);而 Threadripper PRO(WRX90)與 EPYC 才有 128 條 PCIe 5.0 與 8/12 通道 ECC,這是多卡並聯與大記憶體模型真正的入場券。

平台一:Ryzen 9(X870E)— 單卡推論的性價比之王

Ryzen 9 9950X3D/9900X3D 搭 X870E 是 2026 年最划算的 AI 入門平台。16 核/12 核的單執行緒效能極強,DDR5 雙通道對「單張 GPU 做推論」這件事完全夠用——因為推論是 受記憶體頻寬與 VRAM 容量限制,不是受 CPU 限制。

它的天花板在擴張性:約 24 條 PCIe 5.0 通道,掛一張 GPU 走 x16 沒問題,但想上第二張卡,通道一拆就掉到 x8/x4,而且雙通道記憶體在大量資料前處理時會吃緊。實務上,Ryzen 9 的甜蜜點是「一張高 VRAM 卡 + 一個量化後的中大型模型」:

  • Llama 3.3 70B Q4_K_M ≈ 43GB:單張 48GB 卡可跑。
  • gpt-oss-20b、Qwen3、Gemma 3 中型模型:32GB 卡綽綽有餘。
  • Flux.1 dev fp8 ≈ 12GB(純權重)、SDXL fp16 ≈ 8–12GB:影像生成單卡順跑;若含 T5 text encoder 與 VAE,整體 pipeline 佔用約 17GB 起。

對應 MAQ 機型就是這幾台 Ryzen 平台:AI-Eco(RTX PRO 4000 24GB|9900X3D,NT$185,000)、AI-Medium(Radeon AI PRO R9700 32GB|預載 gpt-oss-20b,NT$155,000)、以及繪圖向的 Stable-Diffusion-Highend(RTX PRO 4500 32GB|9950X3D|預載 ComfyUI,NT$277,000)。預算有限、確定只跑單卡、要的是性價比——Ryzen 9 就是答案。

平台二:Threadripper / Threadripper PRO — 多卡與大模型的關鍵分水嶺

當需求從「跑得動 70B」升級到「跑得快、跑全精度、要微調、要掛多張卡」,就必須跨進 Threadripper 家族。這裡要分兩條線講,因為差異很大。

TRX50(Threadripper 9960X):高階桌面的甜蜜點

9960X 24 核、約 80 條可用 PCIe 5.0、4 通道記憶體,是「比 Ryzen 強一階、又比 PRO 便宜很多」的選擇。約 80 條通道足以撐 2 張全速 x16 GPU,或 2–3 張 x8,4 通道記憶體在資料前處理與 RAG 向量庫場景明顯比雙通道從容。

MAQ 的 AI-High 正是這條線:RTX PRO 5000 48GB|Threadripper 9960X 24 核|128GB ECC,NT$567,000。單張 48GB 卡跑 70B Q4(約 43GB)剛好,128GB ECC 系統記憶體則讓你能安心做長時間批次推論與資料管線,不用擔心位元翻轉。要跑 70B、又想保留 1–2 張卡擴張空間的研究室與中型團隊,AI-High 是最務實的起點。

WRX90(Threadripper PRO 9975WX / 9995WX):多卡 LLM 的正解

真正的關鍵在 PRO 系列搭 WRX90 晶片組:128 條 PCIe 5.0 通道、8 通道 DDR5 ECC RDIMM、原生支援 4–7 張卡並聯。為什麼多卡 LLM 訓練/大模型非它不可?因為通道與記憶體是硬性物理限制:

  • 全精度 70B FP16 ≈ 140GB:單卡放不下,必須多卡張量切分(tensor parallelism)。
  • 標準 LoRA 微調 70B ≈ 160GB:同樣需要多卡並聯才裝得下。
  • 4 張 GPU 各要 x16:4×16 = 64 條,只有 128 條通道平台撐得起;Ryzen 的 24 條根本不夠分。

這裡有個 2026 年的重要工程現實要說清楚:PCIe 5.0 x16 約 64 GB/s,而 NVLink 約 900 GB/s(約 14 倍)。對推論而言,多卡靠 PCIe 做張量切分表現出乎意料地好——因為推論是記憶體頻寬受限,PCIe 頻寬通常夠用;但對訓練而言,GPU 之間要不斷交換梯度,互連頻寬就成了「3 天跑完」和「3 週跑完」的差距。所以多卡平台的價值在於:給每張卡充足的 PCIe 通道,並保留足夠記憶體做 CPU offload 與資料供給,把瓶頸壓到最低。

MAQ 對應兩台旗艦:

  • AI-Highend:RTX PRO 6000 96GB Blackwell|Threadripper PRO 9975WX 32 核|256GB ECC|預載 gpt-oss-120b,NT$1,145,000。gpt-oss-120b 的 MXFP4 checkpoint 約 60GB(乾淨運行含 KV cache 與 context 開銷一般以 80GB 為基準),而 RTX PRO 6000 為 96GB,單卡載入餘裕充足,且 Blackwell 原生加速 MXFP4,同時保留多卡擴張空間。
  • AMD-WRX9096 核 Threadripper PRO 9995WX|RTX PRO 6000 96GB|256GB ECC|WRX90 原生 4–7 卡並聯,NT$1,410,000。這是「要做全精度訓練、標準 LoRA、或把多張 96GB 卡串成數百 GB VRAM 池」的最終形態。

平台三:EPYC — 伺服器級的最大記憶體與通道

EPYC 9005「Turin」是資料中心 CPU:最高 192 核、12 通道 DDR5、單路每顆 6TB 記憶體、128 條 PCIe 5.0(雙路 160 條)。它的優勢不在「跑單一 LLM 比 Threadripper PRO 快」,而在極端的記憶體容量與多路擴張:超大規模 RAG 向量庫、TB 級資料集的 CPU 端前處理、科學模擬、或一機多租戶服務多個團隊。

但對絕大多數 AI 工作站需求來說,EPYC 往往是「過頭」的選擇:BMC、RDIMM、雙路主機板把成本墊高,而單卡或 4 卡 LLM 場景用 Threadripper PRO 的 128 條通道與 8 通道 ECC 就已經夠了,還省下可觀預算與更好的單核時脈。除非你真的需要 TB 級系統記憶體或伺服器機房密度,否則 WRX90 通常是更聰明的甜蜜點。

那「上雲端 API」呢?地端的真正理由

很多人會問:2026 年雲端 LLM API 這麼便宜(GPT-5.2 約 input US$1.75/output US$14 每百萬 token、Gemini 2.5 Flash 等級約 US$0.30/US$2.50 每百萬 token),為什麼還要自己買機器?這是個誠實的問題,答案要分清楚:

  • 純成本:對多數團隊,token 量不大時雲端 API 確實更省;損益平衡點視對標模型而定,約落在每月 10–50 億 token 量級(對標 frontier 閉源模型較低、對標已壓到薄利的開源模型 API 較高),超過後地端才開始全面勝出。
  • 資料主權與合規:這才是地端的決定性理由。醫療、法務、研發機密、政府標案的資料不能出區網,再便宜的雲端 API 也不能用。
  • 長期重負載:固定高用量、需要可預測成本、要微調自有模型的場景,地端攤提後單位成本遠低於 API。

MAQ 的定位正是後兩者:資料 100% 留在地端。例如企業地端 RAG 知識主機 MAQ Atlas,單張 RTX PRO 6000 96GB 載 gpt-oss-120B,實測 161 tok/s、8 人並行、資料不出區網——這是雲端 API 結構上做不到的隱私保證。

一句話選型指南

  • 單卡推論、要性價比 → Ryzen 9(X870E):AI-Eco / AI-Medium
  • 跑 70B、留 1–2 卡擴張 → Threadripper TRX50:AI-High
  • 大模型 + 多卡微調/訓練 → Threadripper PRO WRX90:AI-Highend / AMD-WRX90
  • TB 級記憶體 / 伺服器密度 → EPYC(專案評估)。

選平台的本質,是先想清楚「未來 2–3 年要擴張到幾張卡、要不要做訓練、資料能不能出區網」,再回頭挑 CPU。把這幾個問題答對,PCIe 通道、記憶體通道、ECC 自然就對齊了。想看完整規格與報價,可逛 MAQ AMD 工作站系列,或先讀 AI 硬體選購指南把需求釐清。所有機型都出廠預裝 Ollama/vLLM/CUDA/Docker,工程師全台(含外島)親送驗機、三年硬體保固,讓你買到的是一台開箱即用的 AI 生產力工具,而不是一堆零件。

規格與價格資訊整理自 AMD 官方規格、Tom's Hardware、Puget Systems、VideoCardz 等公開資料(2026 年),以及 MAQ 實機驗證數據;VRAM 數字為保守、標量化前提估算,實際需求依模型版本與量化方式而異。

常見問題

AI 工作站要跑多卡 LLM,為什麼一定要選 Threadripper PRO(WRX90)而不是 Ryzen 9?

因為 PCIe 通道數是硬性物理限制。Ryzen 9(X870E)只有約 24 條 PCIe 5.0 通道與雙通道記憶體,掛單卡走 x16 沒問題,但第二張卡就要降到 x8/x4。多卡並聯時,每張高階 GPU 想吃滿 x16,4 張就需要 64 條通道,只有 Threadripper PRO 搭 WRX90 的 128 條 PCIe 5.0 與 8 通道 ECC 記憶體撐得起,並原生支援 4–7 卡並聯。MAQ 對應機型是 AI-Highend(9975WX)與 AMD-WRX90(96 核 9995WX)。

Llama 3.3 70B 在地端要多少 VRAM?單卡跑得動嗎?

看量化方式。70B 在 Q4_K_M(4-bit)約佔 43GB,單張 48GB 卡(如 RTX PRO 5000)剛好跑得動,對應 MAQ 的 AI-High。但若要全精度 FP16,70B 約需 140GB、標準 LoRA 微調約 160GB,單卡放不下,必須多卡張量切分,這時就需要 WRX90 平台。至於 gpt-oss-120b,MXFP4 checkpoint 本身約 60GB,但乾淨運行含 KV cache 與 context 一般以 80GB 為基準;因 RTX PRO 6000 為 96GB,單卡載入餘裕充足(Blackwell 原生加速 MXFP4)。

Threadripper、EPYC、Ryzen 三個 AMD 平台到底差在哪?

差在擴張能力,不是跑分。Ryzen 9(X870E)約 24 條 PCIe 5.0、雙通道記憶體,定位主流性價比、單卡為主。Threadripper 9960X(TRX50)約 80 條可用 PCIe 5.0、4 通道記憶體,是高階桌面甜蜜點(實際條數依主機板與計入方式而異)。Threadripper PRO(WRX90)128 條 PCIe 5.0、8 通道 ECC、原生多卡並聯,是多卡 LLM 正解。EPYC(伺服器級)最高 192 核、12 通道、每路 6TB 記憶體,適合 TB 級記憶體與機房密度,但對多數 AI 工作站常是過頭的選擇。

雲端 LLM API 這麼便宜,2026 年還有必要自己買 AI 工作站嗎?

看資料能不能出區網。純比 token 成本,量不大時雲端 API(如 Gemini 2.5 Flash 約 US$0.30/US$2.50 每百萬 token)通常更省,地端的損益平衡點視對標模型而定,約在每月 10–50 億 token 量級之後才全面勝出。但醫療、法務、研發機密、政府標案的資料不能離開地端,再便宜的 API 也不能用——這才是地端的決定性理由。MAQ 主打資料 100% 留地端,例如 Atlas RAG 主機單卡 gpt-oss-120B 實測 161 tok/s、8 人並行、資料不出區網。

預算有限,AI 工作站該從哪一台開始?

若確定只跑單卡推論,從 Ryzen 9 平台起步最划算:MAQ AI-Medium(Radeon AI PRO R9700 32GB|預載 gpt-oss-20b,NT$155,000)或 AI-Eco(RTX PRO 4000 24GB,NT$185,000)。若要跑 70B 並保留 1–2 卡擴張空間,建議直接上 AI-High(Threadripper 9960X|48GB 卡|128GB ECC,NT$567,000)。可先讀 MAQ 的 AI 硬體選購指南(/ai-hardware/)釐清需求,再對照 /shop/amd/ 選型。

不確定該選幾核、幾條通道?讓 MAQ 幫你對齊工作負載

從性價比的 Ryzen 9 到 96 核原生多卡並聯的 WRX90,MAQ 全系列出廠預裝 Ollama/vLLM/CUDA,工程師全台親送驗機、三年保固。