美國對中國高階 AI 晶片的限制,原本有一個清楚假設:只要把最先進的 GPU、先進製程、HBM 與相關設備堵住,中國模型公司就會在算力天花板前停下來。這個假設現在沒有失效,但正在被迫改寫。Financial Times 今天把 Huawei 的半導體回升放進這個問題裡看:當單顆晶片追不上 Nvidia 時,Huawei 不是只在晶片本身硬追,而是把更多落後一截的晶片、互連、系統架構與本土部署條件綁成一台更大的 AI 機器。
CloudMatrix 384 就是這個轉向最容易被看見的樣子。它不是一顆晶片,也不是單純一台伺服器,而是一個把 384 顆 Ascend 910C 串起來的系統級平台。Network World 引述技術分析指出,Nvidia Blackwell B200 在單顆晶片性能、HBM 容量與頻寬上仍明顯領先;但 Huawei 透過放進更多 compute 與 HBM,在系統層把差距扭成另一種比較。SemiAnalysis 的說法更直接:CloudMatrix 384 的 all-to-all topology 與大量晶片堆疊,讓它在部分系統指標上可以和 Nvidia GB200 NVL72 放在同一張表裡看。
這不是「Huawei 已經打敗 Nvidia」的故事。比較準確的說法是,美國管制正在從晶片出口,變成一場系統工程與供應鏈韌性的拉鋸。單顆 Ascend 910C 如果只有 Blackwell 一部分能力,理論上會被先進 GPU 拉開;但如果一家廠商可以接受更高功耗、更高複雜度、更多機櫃和更麻煩的軟體調校,它就能用系統級設計換回一部分可用算力。出口管制原本想讓缺口變成終點,CloudMatrix 類產品則把缺口改成工程題。

代價也很清楚。Network World 引述 Fab Economics 的判斷,CloudMatrix 384 的功耗可能是 Nvidia GB200 NVL72 的四倍以上,若用每單位算力來看,效率仍落後。這代表它不是一條免費捷徑,而是一種用電力、空間、資本支出與工程複雜度換算力的路線。中國相對充足且可調度的電力、國內大型雲與國企客戶,以及不容易買到 Nvidia 高階系統的市場環境,讓這種取捨變得比較合理;換到電力和資料中心許可都緊繃的市場,它的吸引力就會下降。
真正讓華府難受的,是這條路線把管制目標變散了。若競爭只看最先進 GPU,政策工具相對單純;但若算力可以從互連、光通訊、HBM 配置、軟體框架、模型量化、資料中心能源與供應鏈繞路一起湊出來,管制就得同時盯很多層。SemiAnalysis 特別提醒,Ascend 生態仍牽涉 HBM、晶圓、設備與第三方供應鏈,並非完全本土閉環。這也說明 Huawei 的回升不是自給自足的終局,而是出口限制下出現的一套繞行工程。
軟體仍是 Nvidia 最深的護城河。CUDA、生態工具、最佳化函式庫、開發者習慣與雲端部署經驗,不會因為一個系統級產品就被抹平。Huawei 可以靠 PyTorch、ONNX、推論平台和本土模型場景降低轉換成本,但企業真正導入時,看的不是展示數字,而是模型能不能穩定跑、錯誤能不能追、成本能不能算、工程團隊能不能維護。中國本土市場可能願意為戰略自主承擔更多切換成本;全球市場則會更挑剔效率、可靠性與軟體成熟度。
這也是為什麼 CloudMatrix 384 的產業意義,比「中國有沒有追上 Nvidia」更大。它提醒市場,AI 基礎設施競爭已經不只是晶片公司之間的跑分比賽,而是國家能源系統、半導體供應鏈、資料中心工程、網路互連、模型架構和軟體工具鏈一起參賽。Nvidia 的優勢還很厚,但它面對的不是單一競品,而是不同國家在限制條件下組出來的替代系統。
接下來要看的,不是 CloudMatrix 能不能在一張規格表上勝出,而是它能不能被大量生產、穩定部署,並在真實模型訓練與推論負載中維持可接受的成本。若答案是肯定的,美國晶片管制仍會有效,但效果會變成延遲與加價,而不是完全封鎖。若答案是否定的,Huawei 的系統級嘗試也仍會留下訊號:前沿 AI 的瓶頸正在下沉到整個資料中心,政策若只盯晶片,會越來越抓不住真正的競爭形狀。
參考來源