AI 工作站要跑多卡 LLM，為什麼一定要選 Threadripper PRO（WRX90）而不是 Ryzen 9？

因為 PCIe 通道數是硬性物理限制。Ryzen 9（X870E）只有約 24 條 PCIe 5.0 通道與雙通道記憶體，掛單卡走 x16 沒問題，但第二張卡就要降到 x8/x4。多卡並聯時，每張高階 GPU 想吃滿 x16，4 張就需要 64 條通道，只有 Threadripper PRO 搭 WRX90 的 128 條 PCIe 5.0 與 8 通道 ECC 記憶體撐得起，並原生支援 4–7 卡並聯。MAQ 對應機型是 AI-Highend（9975WX）與 AMD-WRX90（96 核 9995WX）。

Llama 3.3 70B 在地端要多少 VRAM？單卡跑得動嗎？

看量化方式。70B 在 Q4_K_M（4-bit）約佔 43GB，單張 48GB 卡（如 RTX PRO 5000）剛好跑得動，對應 MAQ 的 AI-High。但若要全精度 FP16，70B 約需 140GB、標準 LoRA 微調約 160GB，單卡放不下，必須多卡張量切分，這時就需要 WRX90 平台。至於 gpt-oss-120b，MXFP4 checkpoint 本身約 60GB，但乾淨運行含 KV cache 與 context 一般以 80GB 為基準；因 RTX PRO 6000 為 96GB，單卡載入餘裕充足（Blackwell 原生加速 MXFP4）。

Threadripper、EPYC、Ryzen 三個 AMD 平台到底差在哪？

差在擴張能力，不是跑分。Ryzen 9（X870E）約 24 條 PCIe 5.0、雙通道記憶體，定位主流性價比、單卡為主。Threadripper 9960X（TRX50）約 80 條可用 PCIe 5.0、4 通道記憶體，是高階桌面甜蜜點（實際條數依主機板與計入方式而異）。Threadripper PRO（WRX90）128 條 PCIe 5.0、8 通道 ECC、原生多卡並聯，是多卡 LLM 正解。EPYC（伺服器級）最高 192 核、12 通道、每路 6TB 記憶體，適合 TB 級記憶體與機房密度，但對多數 AI 工作站常是過頭的選擇。

雲端 LLM API 這麼便宜，2026 年還有必要自己買 AI 工作站嗎？

看資料能不能出區網。純比 token 成本，量不大時雲端 API（如 Gemini 2.5 Flash 約 US$0.30／US$2.50 每百萬 token）通常更省，地端的損益平衡點視對標模型而定，約在每月 10–50 億 token 量級之後才全面勝出。但醫療、法務、研發機密、政府標案的資料不能離開地端，再便宜的 API 也不能用——這才是地端的決定性理由。MAQ 主打資料 100% 留地端，例如 Alishan RAG 主機單卡 gpt-oss-120B 實測 161 tok/s、8 人並行、資料不出區網。

預算有限，AI 工作站該從哪一台開始？

若確定只跑單卡推論，從 Ryzen 9 平台起步最划算：MAQ AI-Medium（Radeon AI PRO R9700 32GB｜預載 gpt-oss-20b，NT$151,000）或 AI-Eco（RTX PRO 4000 24GB，NT$152,000）。若要跑 70B 並保留 1–2 卡擴張空間，建議直接上 AI-High（Threadripper 9960X｜48GB 卡｜128GB ECC，NT$706,000）。可先讀 MAQ 的 AI 硬體選購指南（/ai-hardware/）釐清需求，再對照 /shop/amd/ 選型。

Threadripper vs EPYC vs Ryzen：2026 AI 工作站 CPU 平台選購評比

2026 年要在自家機房或研究室組一台 AI 工作站，GPU 通常是大家第一個盯著看的零件，但真正決定「這台機器能不能擴張、能不能上多卡、能不能餵飽 GPU」的，其實是底層的 CPU 平台。同樣是 AMD，Ryzen 9、Threadripper／Threadripper PRO、EPYC 是三條完全不同的產品線，差別不在跑分高低，而在 PCIe 通道數、記憶體通道與容量、ECC 支援、以及能掛幾張顯卡。選錯平台，再貴的 GPU 也會被卡在通道與頻寬瓶頸上。

這篇評比會用工程角度把三個平台拆開講清楚：誰適合單卡推論、誰適合多卡微調、誰才撐得起全精度訓練與超大記憶體模擬，最後對照 MAQ 對應的實機選型，讓你讀完直接知道該下哪一台。

先講結論：CPU 平台決定的不是速度，是「擴張天花板」

對 AI 工作負載來說，CPU 本身很少是瓶頸——瓶頸幾乎都來自 GPU 餵不飽或顯卡掛不上去。所以選平台要看四件事：

PCIe 5.0 通道數：每張高階 GPU 想吃滿 x16，多卡時通道夠不夠分。
記憶體通道與容量：資料前處理、向量庫、KV cache 溢位、CPU offload 都吃系統記憶體頻寬。
ECC：長時間訓練／推論要避免位元翻轉造成的隱性錯誤。
多卡並聯能力：能不能原生掛 4–7 張卡、每張都有充足通道。

GPU 決定「模型跑不跑得動」，CPU 平台決定「你能把這套架構擴張到多大」。

三大平台規格對照（2026）

下表整理 2026 年三條產品線的關鍵差異。數字以 Zen 5 世代（Ryzen 9000、Threadripper 9000／PRO 9000WX、EPYC 9005「Turin」）為準：

項目	Ryzen 9（X870E / AM5）	Threadripper（TRX50）	Threadripper PRO（WRX90）	EPYC（伺服器級）
代表型號	9950X3D / 9900X3D	9960X（24核）	9975WX（32核）/ 9995WX（96核）	9005 Turin（最高 192核）
PCIe 5.0 通道	約 24 條可用	約 80 條可用（含晶片組通道可更高）	128 條	128 條（單路）/ 160 條（雙路）
記憶體通道	2（雙通道）	4	8（ECC RDIMM）	12（ECC RDIMM）
記憶體容量上限	約 192GB UDIMM	數百 GB	到 1TB+ 等級	每路最高 6TB
ECC	需主機板支援（UDIMM）	支援 RDIMM ECC	原生 RDIMM ECC	原生 RDIMM ECC
實際多卡上限	1 卡為主（第 2 卡降速）	2–3 卡	4–7 卡	視主機板，可多卡
定位	主流 / 性價比	高階桌面（HEDT）	專業工作站	資料中心 / 伺服器

一眼就能看出分水嶺：Ryzen 9 只有約 24 條 PCIe 5.0 與雙通道記憶體，掛單卡綽綽有餘，但第二張卡就要跟主機板搶通道、通常降到 x8/x4；Threadripper 9960X 跳到約 80 條可用 PCIe 5.0 與 4 通道（實際條數依主機板與計入方式而異）；而 Threadripper PRO（WRX90）與 EPYC 才有 128 條 PCIe 5.0 與 8／12 通道 ECC，這是多卡並聯與大記憶體模型真正的入場券。

平台一：Ryzen 9（X870E）— 單卡推論的性價比之王

Ryzen 9 9950X3D／9900X3D 搭 X870E 是 2026 年最划算的 AI 入門平台。16 核／12 核的單執行緒效能極強，DDR5 雙通道對「單張 GPU 做推論」這件事完全夠用——因為推論是 受記憶體頻寬與 VRAM 容量限制，不是受 CPU 限制。

它的天花板在擴張性：約 24 條 PCIe 5.0 通道，掛一張 GPU 走 x16 沒問題，但想上第二張卡，通道一拆就掉到 x8/x4，而且雙通道記憶體在大量資料前處理時會吃緊。實務上，Ryzen 9 的甜蜜點是「一張高 VRAM 卡 + 一個量化後的中大型模型」：

Llama 3.3 70B Q4_K_M ≈ 43GB：單張 48GB 卡可跑。
gpt-oss-20b、Qwen3、Gemma 3 中型模型：32GB 卡綽綽有餘。
Flux.1 dev fp8 ≈ 12GB（純權重）、SDXL fp16 ≈ 8–12GB：影像生成單卡順跑；若含 T5 text encoder 與 VAE，整體 pipeline 佔用約 17GB 起。

對應 MAQ 機型就是這幾台 Ryzen 平台：AI-Eco（RTX PRO 4000 24GB｜9900X3D，NT$152,000）、AI-Medium（Radeon AI PRO R9700 32GB｜預載 gpt-oss-20b，NT$151,000）、以及繪圖向的 Stable-Diffusion-Highend（RTX PRO 4500 32GB｜9950X3D｜預載 ComfyUI，NT$277,000）。預算有限、確定只跑單卡、要的是性價比——Ryzen 9 就是答案。

平台二：Threadripper / Threadripper PRO — 多卡與大模型的關鍵分水嶺

當需求從「跑得動 70B」升級到「跑得快、跑全精度、要微調、要掛多張卡」，就必須跨進 Threadripper 家族。這裡要分兩條線講，因為差異很大。

TRX50（Threadripper 9960X）：高階桌面的甜蜜點

9960X 24 核、約 80 條可用 PCIe 5.0、4 通道記憶體，是「比 Ryzen 強一階、又比 PRO 便宜很多」的選擇。約 80 條通道足以撐 2 張全速 x16 GPU，或 2–3 張 x8，4 通道記憶體在資料前處理與 RAG 向量庫場景明顯比雙通道從容。

MAQ 的 AI-High 正是這條線：RTX PRO 5000 48GB｜Threadripper 9960X 24 核｜128GB ECC，NT$706,000。單張 48GB 卡跑 70B Q4（約 43GB）剛好，128GB ECC 系統記憶體則讓你能安心做長時間批次推論與資料管線，不用擔心位元翻轉。要跑 70B、又想保留 1–2 張卡擴張空間的研究室與中型團隊，AI-High 是最務實的起點。

WRX90（Threadripper PRO 9975WX / 9995WX）：多卡 LLM 的正解

真正的關鍵在 PRO 系列搭 WRX90 晶片組：128 條 PCIe 5.0 通道、8 通道 DDR5 ECC RDIMM、原生支援 4–7 張卡並聯。為什麼多卡 LLM 訓練／大模型非它不可？因為通道與記憶體是硬性物理限制：

全精度 70B FP16 ≈ 140GB：單卡放不下，必須多卡張量切分（tensor parallelism）。
標準 LoRA 微調 70B ≈ 160GB：同樣需要多卡並聯才裝得下。
4 張 GPU 各要 x16：4×16 = 64 條，只有 128 條通道平台撐得起；Ryzen 的 24 條根本不夠分。

這裡有個 2026 年的重要工程現實要說清楚：PCIe 5.0 x16 約 64 GB/s，而 NVLink 約 900 GB/s（約 14 倍）。對推論而言，多卡靠 PCIe 做張量切分表現出乎意料地好——因為推論是記憶體頻寬受限，PCIe 頻寬通常夠用；但對訓練而言，GPU 之間要不斷交換梯度，互連頻寬就成了「3 天跑完」和「3 週跑完」的差距。所以多卡平台的價值在於：給每張卡充足的 PCIe 通道，並保留足夠記憶體做 CPU offload 與資料供給，把瓶頸壓到最低。

MAQ 對應兩台旗艦：

AI-Highend：RTX PRO 6000 96GB Blackwell｜Threadripper PRO 9975WX 32 核｜256GB ECC｜預載 gpt-oss-120b，NT$1,247,000。gpt-oss-120b 的 MXFP4 checkpoint 約 60GB（乾淨運行含 KV cache 與 context 開銷一般以 80GB 為基準），而 RTX PRO 6000 為 96GB，單卡載入餘裕充足，且 Blackwell 原生加速 MXFP4，同時保留多卡擴張空間。
AMD-WRX90：96 核 Threadripper PRO 9995WX｜RTX PRO 6000 96GB｜256GB ECC｜WRX90 原生 4–7 卡並聯，NT$1,515,000。這是「要做全精度訓練、標準 LoRA、或把多張 96GB 卡串成數百 GB VRAM 池」的最終形態。

平台三：EPYC — 伺服器級的最大記憶體與通道

EPYC 9005「Turin」是資料中心 CPU：最高 192 核、12 通道 DDR5、單路每顆 6TB 記憶體、128 條 PCIe 5.0（雙路 160 條）。它的優勢不在「跑單一 LLM 比 Threadripper PRO 快」，而在極端的記憶體容量與多路擴張：超大規模 RAG 向量庫、TB 級資料集的 CPU 端前處理、科學模擬、或一機多租戶服務多個團隊。

但對絕大多數 AI 工作站需求來說，EPYC 往往是「過頭」的選擇：BMC、RDIMM、雙路主機板把成本墊高，而單卡或 4 卡 LLM 場景用 Threadripper PRO 的 128 條通道與 8 通道 ECC 就已經夠了，還省下可觀預算與更好的單核時脈。除非你真的需要 TB 級系統記憶體或伺服器機房密度，否則 WRX90 通常是更聰明的甜蜜點。

那「上雲端 API」呢？地端的真正理由

很多人會問：2026 年雲端 LLM API 這麼便宜（GPT-5.2 約 input US$1.75／output US$14 每百萬 token、Gemini 2.5 Flash 等級約 US$0.30／US$2.50 每百萬 token），為什麼還要自己買機器？這是個誠實的問題，答案要分清楚：

純成本：對多數團隊，token 量不大時雲端 API 確實更省；損益平衡點視對標模型而定，約落在每月 10–50 億 token 量級（對標 frontier 閉源模型較低、對標已壓到薄利的開源模型 API 較高），超過後地端才開始全面勝出。
資料主權與合規：這才是地端的決定性理由。醫療、法務、研發機密、政府標案的資料不能出區網，再便宜的雲端 API 也不能用。
長期重負載：固定高用量、需要可預測成本、要微調自有模型的場景，地端攤提後單位成本遠低於 API。

MAQ 的定位正是後兩者：資料 100% 留在地端。例如企業地端 RAG 知識主機 MAQ Alishan，單張 RTX PRO 6000 96GB 載 gpt-oss-120B，實測 161 tok/s、8 人並行、資料不出區網——這是雲端 API 結構上做不到的隱私保證。

一句話選型指南

單卡推論、要性價比 → Ryzen 9（X870E）：AI-Eco / AI-Medium。
跑 70B、留 1–2 卡擴張 → Threadripper TRX50：AI-High。
大模型 + 多卡微調／訓練 → Threadripper PRO WRX90：AI-Highend / AMD-WRX90。
TB 級記憶體 / 伺服器密度 → EPYC（專案評估）。

選平台的本質，是先想清楚「未來 2–3 年要擴張到幾張卡、要不要做訓練、資料能不能出區網」，再回頭挑 CPU。把這幾個問題答對，PCIe 通道、記憶體通道、ECC 自然就對齊了。想看完整規格與報價，可逛 MAQ AMD 工作站系列，或先讀 AI 硬體選購指南把需求釐清。所有機型都出廠預裝 Ollama／vLLM／CUDA／Docker，工程師全台（含外島）親送驗機、三年硬體保固，讓你買到的是一台開箱即用的 AI 生產力工具，而不是一堆零件。

規格與價格資訊整理自 AMD 官方規格、Tom's Hardware、Puget Systems、VideoCardz 等公開資料（2026 年），以及 MAQ 實機驗證數據；VRAM 數字為保守、標量化前提估算，實際需求依模型版本與量化方式而異。