「跑 Stable Diffusion/Flux 的出圖機到底要買多少 VRAM 才夠?」這是我們最常被企業設計部門、電商美術組與研究室問到的問題。答案不是「越大越好」,而是看你跑哪個模型、要不要邊訓 LoRA 邊推論、以及商用環境能不能用消費級顯卡。本文以 2026 年實測的 VRAM 數據,把 SDXL、Flux.1、SD3.5 三大主力模型與三個價位帶的機型對齊,幫你一次選對。
先搞懂:出圖模型的 VRAM 需求差很大
很多人把「Stable Diffusion」當成單一模型,實際上 2026 年商用出圖的主力是三條產品線,各自的顯存胃口天差地遠。選機之前,先把「你要跑什麼」釐清:
| 模型 | 典型精度 | 推論 VRAM(含工作流) | 定位 |
|---|---|---|---|
| SDXL 1.0 | fp16 | 約 8–12GB(含 refiner 上看 16GB) | 成熟、生態最廣、LoRA 最多 |
| SD 3.5 Large | fp16 / fp8 | 約 11–18GB(fp8 量化後 ~11GB) | 提示詞理解強、排版文字佳 |
| Flux.1 dev | fp8 | 約 13–17GB | 細節與真實感頂尖 |
| Flux.1 dev | fp16 | 約 24GB | 全精度,品質天花板 |
關鍵結論:SDXL 在 8–12GB 卡上就跑得很順,但 Flux.1 dev 全精度 fp16 直接逼近 24GB。如果你的設計團隊要追 Flux 的真實感與細節(產品圖、人像、廣告視覺),24GB 是「不被綁手綁腳」的起跑線;想留全精度餘裕、同時掛 ControlNet 與多個 LoRA,32GB 才是舒適區。
出圖機的 VRAM 不是只裝模型權重,還要留給工作流:ControlNet 加 1–3GB、放大(upscale)節點、refiner 同載、批次出圖——這些疊起來,「剛好塞得下」往往等於「跑起來很卡」。
ComfyUI 工作流:VRAM 的隱形成本
2026 年商用出圖幾乎都走 ComfyUI 節點式工作流,因為它能把文生圖、ControlNet、IP-Adapter、區域重繪、多階段放大串成一條可複用的管線。但工作流越複雜,顯存的隱形開銷越高:
- ControlNet:每掛一個模型約 +1–3GB,多重 ControlNet 疊用很常見。
- Refiner 同載:SDXL 要最高品質就得把 base + refiner 一起放,記憶體上看 16GB。
- 高解析放大:tiled upscale 雖能省顯存,但全圖一次放大才快,這吃 VRAM。
- 批次(batch)出圖:商用最在意「一小時能出幾張」,加大 batch size 直接乘上顯存佔用。
所以同樣跑 Flux.1,個人玩家用 fp8 塞進 16GB 沒問題,但商用環境要「一條工作流跑到底、不爆顯存、不降速」,24GB 起跳、32GB 安心。這也是為什麼 MAQ 的出圖機從 24GB 級距才開始算「商用」。
邊訓 LoRA 邊推論:48GB 的分水嶺
真正把成本拉高的,不是出圖,而是「訓練 LoRA」這件事,尤其是邊訓邊出圖。很多公司想自己訓專屬風格/角色/產品的 LoRA,這條需求把硬體門檻往上推了一大截:
- SDXL LoRA 訓練:1024×1024 解析度下,依 batch 與梯度檢查點設定,約需 13–24GB。12GB 是勉強下限(要降解析度、開優化),24GB 才是順手。
- Flux LoRA 訓練:因模型本體更大,顯存壓力又更高,全精度訓練常需 24GB 以上。
- 邊訓邊推論:如果你想「一邊跑訓練任務、一邊讓設計師繼續出圖」,等於同時佔用兩份顯存——這時 48GB 才有同卡並行的空間,不必為了訓練停掉產線。
這就是 24GB → 32GB → 48GB 的真實升級邏輯:
| 使用情境 | 建議 VRAM | 說明 |
|---|---|---|
| SDXL/Flux fp8 出圖、單一工作流 | 24GB | 商用入門,ComfyUI 順跑 |
| Flux fp16 全精度+多 ControlNet/LoRA | 32GB | 品質天花板+工作流餘裕 |
| 邊訓 LoRA 邊推論、訓推並行 | 48GB | 產線不停、訓練與出圖同卡共存 |
消費級 RTX 5090 vs RTX PRO 工作站卡:差在哪?
選機時一定會碰到的抉擇:「RTX 5090 也是 32GB、又便宜,為什麼不直接買它跑出圖?」這是好問題,但商用採購要看的不只是 VRAM 數字:
- ECC 記憶體:RTX 5090 沒有 ECC;RTX PRO 系列有。長時間訓練 LoRA 時,一個無聲的記憶體位元翻轉可能默默污染權重而不報錯,ECC 是生產環境的保險。
- 驅動授權:消費級 GeForce 驅動的 EULA 明文限制資料中心商用部署;RTX PRO 走 Enterprise 驅動,認證週期長、適合 7×24 產線。對企業合規這是硬指標。
- 穩定度取向:5090 衝的是短時間爆發的峰值算力與時脈;RTX PRO 為持續負載設計,長跑批次出圖與訓練更不掉速。
- 顯存上限:5090 卡死在 32GB;RTX PRO 5000 上 48GB、PRO 6000 上 96GB,這是 5090 物理上做不到的訓推並行與大模型空間。
所以結論很務實:RTX 5090 是史上最強的消費級 AI 卡,個人創作者或預算敏感的小團隊出圖機,它的性價比無可挑剔;但若是要進產線、要跑訓練、要合規、要 ECC,就該選 RTX PRO 工作站卡。MAQ 兩條路線都備——想要 5090 的甜蜜點,有 AI-TOP-Z890-RTX5090(RTX 5090 32GB Blackwell|Core Ultra 9 24 核|128GB,NT$269,000);要走 Pro 路線,下一段直接對應機型。
MAQ 出圖機三檔對照:24GB → 32GB → 48GB
把上面的需求邏輯落到實機,MAQ 的對應方案如下。價格與配置以官網為準:
| 機型 | GPU/VRAM | CPU・記憶體 | 定位 | 價格 |
|---|---|---|---|---|
| AI-Eco | RTX PRO 4000 / 24GB | Ryzen 9 9900X3D 12 核・32GB | 商用出圖入門,SDXL/Flux fp8 順跑 | NT$185,000 |
| Stable-Diffusion-Highend | RTX PRO 4500 / 32GB | 9950X3D・64GB(預載 ComfyUI) | Flux fp16 全精度+多工作流主力 | NT$272,000 |
| AI-High | RTX PRO 5000 / 48GB | Threadripper 9960X 24 核・128GB ECC | 邊訓 LoRA 邊推論、訓推並行 | NT$567,000 |
怎麼挑:對號入座
- 剛起步、以出圖為主 → AI-Eco(24GB)。SDXL 全精度、Flux.1 fp8 都從容,ComfyUI 單一工作流不卡。
- 美術/廣告主力產線 → Stable-Diffusion-Highend(32GB,出廠已裝 ComfyUI)。撐得起 Flux.1 dev fp16 全精度,多 ControlNet 與 LoRA 並掛仍有餘裕,這是品質與穩定的甜蜜點。
- 要自己訓 LoRA、且不想停產線 → AI-High(48GB ECC)。訓練與出圖可在同卡並行,ECC 保護長跑訓練,128GB ECC 系統記憶體餵得飽資料前處理。
若你的需求同時包含「跑大型語言模型」與「出圖」,例如想在同一台機器上既跑 70B(4-bit Q4_K_M 約 43GB,單卡 48GB 可容)又出圖,AI-High 的 48GB 也是合理交集;更大規模的多卡並聯與 96GB 單卡需求,則可往 AI 工作站系列 的高階機型延伸。
自建 vs 雲端出圖 API:什麼時候該買機器?
2026 年雲端出圖 API 已經很便宜:Flux.1 dev 在主流平台約 每張 US$0.025、Flux Pro 約 US$0.05,開源模型透過聚合平台甚至低到 US$0.008–0.04/張。那為什麼還要買出圖機?算一筆帳就清楚:
- 量大就回本:以每張 US$0.025 估,一台 32GB 出圖機若每天產 2,000 張商用圖,雲端月費約 US$1,500(約 NT$48,000/月)。買 Stable-Diffusion-Highend 約 5–6 個月即打平,之後幾乎零邊際成本。
- 資料留地端:客戶素材、未上市產品圖、人像授權內容——這些不該外流到第三方 API。MAQ 出圖機資料 100% 留在地端/區網內,符合營業秘密與隱私要求。
- 客製自由度:自訓 LoRA、換 checkpoint、調工作流、接內部系統,雲端 API 給不了這種底層掌控。
- 無速率限制:自有機器沒有 API rate limit,趕件時 batch 開到底,產能由你掌握。
雲端 API 適合「量不大、需求多變、不想養機器」;一旦你的出圖變成穩定的生產流程,自建機器在成本、隱私與掌控度上全面勝出。
不只是硬體:出廠即用與在地服務
商用出圖機真正的痛點,往往不是顯卡,而是「環境裝到崩潰」。MAQ 的出圖機出廠就預裝 ComfyUI、CUDA、Docker、Ollama、vLLM、MLX、n8n、LangGraph、CrewAI 等完整環境,開機即出圖,不用自己跟驅動與相依套件搏鬥。配套還包括:
- 工程師全台(含外島)親送驗機,到現場確認跑得起來才算交付。
- 三年硬體保固,簽約戶提供備機,產線不中斷。
- 遠端+到府技術支援、Proxmox VE 虛擬化,多人共用一台機器分流出圖任務。
- 地端資安:所有素材與模型權重留在你的機房,不出區網。
結論:先定位需求,再對號選機
選出圖機的順序永遠是「需求 → VRAM → 機型」,而不是先看價格:
- 只出圖、以 SDXL/Flux fp8 為主 → 24GB(AI-Eco,NT$185,000)。
- 追 Flux 全精度品質、多工作流並行 → 32GB(Stable-Diffusion-Highend,預載 ComfyUI)。
- 要自訓 LoRA、訓推並行、要 ECC 與商用合規 → 48GB(AI-High)。
- 預算敏感、不進產線的個人創作 → 消費級 RTX 5090(AI-TOP-Z890-RTX5090)也是好選擇。
想更全面比較 AI 硬體配置,可參考我們的 AI 硬體選購指南;出圖機完整型號與報價,都在 Stable Diffusion 出圖機系列。把需求講清楚,剩下的選機與環境,MAQ 幫你搞定。