在人工智慧(AI)浪潮席捲全球的時代,晶片大廠輝達NVIDIA 作為加速運算的領導者,再次投下震撼彈。繼成功的 Hopper 架構後,輝達NVIDIA在 GTC大會 上隆重推出其最新一代GPU架構——Blackwell。NVIDIA 執行長黃仁勳將其譽為「推動這場新工業革命的引擎」,旨在徹底打破運算和生成式AI 與高效能運算(HPC)的現有瓶頸。
Blackwell 不僅僅是一次硬體升級,它代表著一個完整的運算平台,其命名源於首位入選美國國家科學院的美國數學家David Blackwell,象徵著對科學探索與多元包容精神的致敬。本文將深入剖析 Blackwell 架構的技術細節、市場應用,並探討其背後龐大的台灣科技生態系統。
Blackwell 是什麼?不僅是晶片,更是運算平台
Blackwell 架構是一個旨在處理兆級參數 AI 模型的全新運算典範。它並非單一顯示卡晶片,而是一個涵蓋 GPU、CPU、高速互連技術及軟體堆疊的完整生態系統。基於此架構,NVIDIA 推出了多款革命性產品,包括:
- B100 / B200 GPU: 作為架構的基礎核心,B 系列繪圖處理器提供了前所未有的運算能力。
- GB200 Grace Blackwell 超級晶片: 這款 NVIDIA Grace Blackwell 產品將兩顆 B200 GPU 與一顆 NVIDIA Grace CPU 透過超低功耗的 NVLink-C2C 互連技術整合,實現了 CPU 與 GPU 記憶體的無縫存取。
- NVIDIA GB200 NVL72: 這是一個機櫃規模(Rack-Scale)的液冷系統,將 36 個 GB200 超級晶片(共 72 顆 Blackwell GPU 與 36 顆 Grace CPU)連接成一個巨大的單一運算實體,被視為「地表最強 AI 晶片」的終極型態,可應對最繁重的工作負載。
這個平台的設計理念是為了應對日益龐大的 AI 模型,讓過去需要耗費巨量資源與時間的訓練和推論任務,得以在成本與能耗大幅降低的情況下實現。
技術架構的革命性突破:Blackwell 的七大核心亮點
Blackwell 之所以被視為革命性產品,源於其集結了多項尖端技術的突破。以下是其最關鍵的七大技術亮點:
1. 雙晶粒整合與台積電 4NP 製程
Blackwell 處理器的生產過程極其精密,從一片空白矽晶圓開始,採用專為 NVIDIA 量身打造的台積電的4奈米製程,經過數百道紫外光微影步驟,單一 GPU 內含高達 2080 億個電晶體。其最大創新在於,它將兩個突破光罩尺寸極限的大型晶粒(Die),透過每秒 10 TB (TB/s) 的晶片互連技術,整合成一顆功能統一的超級顯示卡晶片。這種設計不僅突破了單一晶片的物理製造極限,也大幅提升了整體運算效能並確保了良率。
2. 第二代 Transformer 引擎
針對大型語言模型(LLM)與專家混合(MoE)模型,Blackwell 搭載了第二代 Transformer 引擎。此引擎結合了 Blackwell Tensor Core 技術,並引入了全新的 4 位元浮點(FP4)AI 推論能力。透過創新的「微張量縮放(micro-tensor scaling)」技術,FP4 得以在維持高精準度的前提下,將模型大小與記憶體需求減半,從而顯著提升推論效能。
3. 第五代 NVLink 與 NVSwitch
為了應對兆級參數 AI 模型所需的龐大數據溝通量,第五代 NVIDIA NVLink 互連技術將每個 GPU 的雙向吞吐量提升至驚人的 1.8 TB/s。透過 NVLink Switch 晶片,單一 NVL72 機櫃(內含 72 顆 GPU)的總頻寬可達 130 TB/s,並能擴展至多達 576 個 GPU 的叢集,確保所有 GPU 之間能進行流暢、無縫的高速通訊。
4. 專用解壓縮引擎
傳統上,資料庫查詢與分析高度依賴 CPU。輝達 Blackwell 內建了專用的解壓縮引擎,支援 LZ4、Snappy 等最新壓縮格式,能以每秒 900 GB 的雙向頻寬,直接加速資料庫的查詢流程。這項創新將 GPU 的應用從 AI 訓練推論,進一步拓展至大規模資料分析與資料科學領域,大幅提升處理效率。
5. 硬體級安全 AI(機密運算)
在 AI 智慧財產權與資料隱私日益重要的今天,Blackwell 整合了 NVIDIA 機密運算技術。它是業界首款支援 TEE-I/O(可信執行環境)的 GPU,能以強大的硬體級安全防護來保護敏感資料與 AI 模型,避免未經授權的存取,且其加密運算效能幾乎與非加密模式並駕齊驅。
6. RAS 可靠性引擎
為了確保大規模 AI 部署的穩定性,Blackwell 配備了專用的可靠性、可用性與可維護性(RAS)引擎。此引擎利用 AI 預測管理功能,持續監控數千個軟硬體資料點,能及早辨識潛在故障,預測停機風險,從而最大化系統的穩定運行時間並降低維運成本。
7. 記憶體規格升級
Blackwell 採用了最新的 8 堆疊 HBM3e 高頻寬記憶體,單顆 B200 GPU 容量高達 192GB,記憶體頻寬達到驚人的 8TB/s,相較於前代 H100 的 3.35TB/s 有了超過兩倍的提升,為處理巨量資料提供了強大的基礎。
Blackwell 概念股:台灣供應鏈的關鍵角色
Blackwell 的誕生是全球協作的成果,其中台灣供應鏈扮演了不可或缺的核心角色。從晶圓代工、先進封裝到伺服器組裝與關鍵零組件,台灣廠商全面參與其中,形成了緊密的「Blackwell 概念股」生態系。
產業鏈環節 | 公司名稱 (股票代碼) | 關聯性與業務範疇 |
---|---|---|
晶圓代工 | 台積電 (2330) | 獨家供應 Blackwell 晶片的 4奈米製程。 |
先進封裝與測試 | 台積電 (2330) | 提供 CoWoS 先進封裝技術,是實現雙晶粒整合的關鍵。 |
日月光投控 (3711) | 提供晶片後段封裝與測試服務,協助提升製造效率。 | |
京元電子 (2449) | 專注於半導體測試,為 Blackwell 提供關鍵的品質驗證。 | |
伺服器/主機板製造 | 鴻海精密 (2317) | 全球最大伺服器代工廠,其伺服器產品直接受惠於 AI 伺服器需求。 |
廣達電腦 (2382) | 旗下雲達科技(QCT)為主要伺服器供應商,與 NVIDIA 深度合作。 | |
緯創 (3231) / 緯穎 (6669) | 專注於雲端資料中心伺服器,是 AI 硬體的主要供應商。 | |
技嘉 (2376) / 英業達 (2356) | 提供基於 Blackwell 架構的 HGX 平台與伺服器解決方案。 | |
關鍵零組件 | 信驊科技 (5274) | 提供伺服器遠端管理晶片(BMC),是資料中心的必備元件。 |
奇鋐 (3017) / 超眾 (6230) | 因應 Blackwell 高達 1000W 的功耗,提供高效液冷與散熱解決方案。 | |
欣興 (3037) / 景碩 (3189) | 供應 CoWoS 所需的 ABF 載板。 |
常見問題 (FAQ)
Q1: Blackwell 架構最關鍵的技術亮點是什麼?
A1: Blackwell架構GPU 的關鍵亮點包括:採用台積電 4NP 製程的雙晶粒整合架構、支援 FP4 精度的第二代 Transformer 引擎、高達 1.8 TB/s 頻寬的第五代 NVLink、用於加速資料庫查詢的解壓縮引擎,以及硬體級機密運算等。
Q2: Blackwell 晶片的主要買家是誰?
A2: 全球主要的雲端客戶與科技巨頭都是其首批買家,包括 Amazon Web Services (AWS)、Google、Microsoft、Meta、Oracle、Tesla、OpenAI 及 xAI 等。
Q3: 為何 Blackwell 晶片的需求如此強勁?
A3: 因為生成式 AI、深度學習和高效能運算等技術的快速發展,對運算能力產生了爆炸性需求。Blackwell 架構提供的效能、效率與擴展性遠超前代,能以更低的成本和能耗處理更大、更複雜的 AI 模型,因此受到市場強烈追捧。
Q4: 台灣在 Blackwell 供應鏈中扮演哪些重要角色?
A4: 台灣扮演了從上游到下游的關鍵角色。台積電負責最核心的晶片製造與 CoWoS 封裝;日月光和京元電等提供封裝測試;鴻海、廣達、緯穎等負責伺服器系統的設計與組裝;而信驊、奇鋐等則提供關鍵的晶片與散熱零組件。可以說,沒有台灣供應鏈,Blackwell 無法順利量產。
總結
NVIDIA Blackwell 架構的推出,不僅是 GPU 技術的一次飛躍,更是對未來 AI 運算模式的重新定義。它透過雙晶粒設計、專用引擎和高速互連技術,為處理前所未有的超大型 AI 模型鋪平了道路,將有助於在資料處理、工程模擬、電子設計自動化、電腦輔助藥物設計、量子運算和生成式 AI 等領域實現突破,堪稱我們這個時代的決定性技術。
市場對其「瘋狂」的需求,以及 AWS、Google、Microsoft、Meta 等全球科技巨頭的第一時間採用,包括對 NVIDIA GB200 Grace Blackwell 和 Blackwell Ultra GPU 系統的期待,已然證明了其無可取代的價值。在這場由 AI 引領的產業革命中,台灣的半導體與伺服器供應鏈憑藉其深厚的技術實力,再次站穩了全球科技核心的地位。可以預見,Blackwell 將在未來數年內,持續作為點燃 AI 產業熊熊烈火的關鍵引擎,引領各行各業邁向全新的智慧化未來。