板級維修頻道 northwestrepair(專做顯卡晶片級/電路板維修,桌上天天躺著一堆燒掉的卡)發了一支新影片,標題很直接:「Another RTX 5090 added to the ‘DO NOT BUY’ list」——又一張 RTX 5090 被他列進「不要買」清單。對一家天天在組 AI 工作站、要替客戶扛三年保固的整機廠來說,這支影片講的東西,正是我們在出貨前最在意的事。先看影片:
northwestrepair 為什麼把它列進清單?
northwestrepair 不是跑分頻道,而是修卡的人——專門把燒毀、短路、故障的顯卡拆開、量測、換料救回來。正因為他看的是「壞掉之後的卡」,他的「DO NOT BUY」清單反映的不是某一張卡跑得快不快,而是哪些卡反覆因為同一個根因進廠。這次把又一張 RTX 5090 列進去,在他看來,重點不在於「這張卡特別爛」,而是 40/50 系列在卡端供電監看上的一個設計取捨,又多了一個案例。(要先說清楚:這份「不要買」清單是他個人、以維修角度出發的編輯性整理,不是官方或業界標準。)
northwestrepair 指向的根因:12V-2×6 接頭少了「分路電流平衡」
RTX 5090 用的是 12V-2×6(前身即 12VHPWR)單一接頭供電,額定 600W、六對 12V 針腳。問題出在卡端(顯卡 PCB 上)怎麼監看這六條線:
- 早年初代用在 RTX 3090 Ti 時,NVIDIA 在卡上放了三顆分流電阻(shunt)、把六條線分成三路(每路兩條)各自偵測電流——某一路明顯失衡時,卡能察覺,甚至以保護機制拒絕開機或關閉輸出。
- 到了 40/50 系列,NVIDIA 把六條 12V 併成一路、只用單一 shunt 偵測「總功率」。結果是:卡根本不知道這六條線是各分擔 1/6,還是其中一條扛了大半電流。
這在接觸完美時沒事,但只要某一根針/某一條線接觸電阻偏高(沒插到底、反覆插拔造成磨耗、線材或端子老化),電流就會往其他線集中。獨立測試者 der8auer 以鉤表實測,曾量到單一條 16AWG 線跑出超過 23A(Buildzoid 則提供供電設計面的分析)——而依這類接頭線材的常見規格,單線約只能承受 8~9A 上下。電流爆表、塑膠端子撐不住,於是熔毀。更值得注意的是:據 TechPowerUp 報導,曾有個案把功耗上限調降 100W(並降壓)後,GPU 端接頭仍然熔毀——這說明問題不全在「總功率太高」,更在「電流分配不均、而卡又看不到」。
不只接頭:missing ROPs 與個別機種狀況
除了供電,RTX 5090 上市以來還有幾件被廣泛報導的事,放在一起看比較公允:
- missing ROPs:NVIDIA 已承認早期少數 RTX 5090/5090D/5080/5070 Ti(官方稱不到 0.5%)因製造瑕疵少一組 ROP,平均約 4% 的繪圖效能差異;NVIDIA 同時表示不影響 AI/運算效能。機率低、可用 GPU-Z 等工具檢查,但買到就是中獎。
- 個別 AIB 機種:據 TweakTown 報導,有 ASUS ROG Astral RTX 5090 使用者回報長期使用後主機板接點區域出現變色;該系列也有黑屏等個別回報。值得一提的是——Astral 反而是少數在接頭每一針都加了電流感測(僅供監看、警示,並不會主動平衡電流)的型號,比多數「看不到」的卡更透明;而據 Tom’s Hardware 報導,即使是 MSI 採用的黃頭(接觸狀態指示)線材,也仍有個別使用者回報熔毀。這說明它更像是整個生態的設計取捨,而非單一廠商的問題。
平心而論:melting 是少數案例,多數 5090 正常運作;部分熔毀也確實可能與安裝沒插到底(人為)有關(連資深評測者都承認自己那張可能是沒插好)。但 40/50 系列在卡端「把分路電流偵測簡化成單一總功率偵測」是可查證的設計事實——它把「安裝品質」與「供電品質」從『建議』變成了『攸關安全的必要條件』。
為什麼這件事,對「跑 AI」比「打電動」更要命
這是我們最想對企業 IT 與工作室講的一點。同樣一張 RTX 5090,遊戲玩家多半是脈衝式負載——忽高忽低、平均功耗遠低於峰值;而AI 訓練、批次推論、出圖農場則常是長時間 100% 滿載,一張卡可在重度負載下逼近其額定 575W TGP、連續運轉好幾個小時甚至好幾天。
接頭熔毀的物理機制,正是「高電流持續累積熱量」。換句話說,AI 工作負載恰好把這個設計弱點的觸發條件拉到最滿。一台擺在機房、7×24 跑推論服務或排程訓練的機器,遠比一台週末打幾小時遊戲的電腦,更需要把供電與散熱做對。
MAQ 觀點:問題不是「別買 5090」,是「裝得對不對」
先說實話——MAQ 自己就有提供 RTX 5090 機型,我們不會假裝這張卡不能用。它的性價比與生態(Blackwell、CUDA、原生 FP4)在很多 AI 場景仍然很有競爭力。真正的重點是 northwestrepair 整支影片的弦外之音:同一張卡,裝得對不對、供電對不對、散熱夠不夠,結局天差地遠。這正是「整機交付」與「裸卡自己裝」最關鍵的差別:
- 用原生供電、不用轉接頭:採用符合 ATX 3.1 的原生 12V-2×6 線材直出,避開老舊延長線、菊鏈與廉價轉接頭——這些正是接觸不良的大宗來源。
- 安裝即做接觸檢查:確認接頭完全插到底、卡榫到位,而不是「看起來插上了」。northwestrepair 修的卡,很多敗在這一步。
- 電源瓦數留足餘裕、規劃機殼風道:不壓著上限硬跑,並確保卡的進排風與機箱氣流足夠帶走長時間滿載的熱。
- 出廠燒機(burn-in)+ 溫控監控:每台機器出貨前做長時間滿載壓測,把接觸不良、規格不符(含 missing ROPs)、散熱不足的問題在我們的工作台上、而不是在你的機房裡抓出來。
- 關鍵任務改走專業級 Blackwell:對 7×24、停機代價高的場景,我們會建議 RTX PRO 6000 96GB/RTX PRO 5000 48GB 這類專業卡——更大的 VRAM、ECC 記憶體、為長時間運算設計的供電與散熱,整體更耐操,並有在地保固。
裸卡自己買回去裝,上面這些(線材、瓦數、風道、燒機驗證、出問題後的保固窗口)全部落在你身上;整機交付,則是由我們用對的料、正確安裝、壓測過再出貨,出狀況有單一窗口在地處理。延伸閱讀我們先前的 AI 工作站採購避坑指南 與 LLM GPU 選購評比。
修卡的人告訴你「不要買」,其實是在說「別這樣裝」。顯卡型號只是起點,把供電、安裝、散熱、燒機驗證做對,才是讓一張卡安全跑滿三年的關鍵。
不確定你的負載該配 RTX 5090 還是專業級 RTX PRO,建議先看我們的 AI 硬體選購指南,把模型大小、並行人數、是否 7×24 與預算對應到合適又安全的規格。
資料來源:northwestrepair 影片「Another RTX 5090 added to the ‘DO NOT BUY’ list」(YouTube);技術背景綜合自 Tom’s Hardware、TechPowerUp、TweakTown、der8auer/Buildzoid 之公開拆解分析,以及 NVIDIA 對 missing ROPs 的官方說明。文中 melting 案例為少數比例、部分可能與安裝有關,本文為 MAQ 之整理與觀點,非指任一型號必然故障;RTX、GeForce 為 NVIDIA 之商標。