ARM and RISC-V in a data center

在我們談論數據中心時,往往會聯想到 CPU(像是 Intel 的 x86、ARM、以及新興的 RISC-V)和 GPU(NVIDIA、AMD 或是各家客製化的 ASIC)之間那場烽火連天的性能大戰。然而,在這場舉世矚目的技術競賽背後,一場更為靜謐卻影響深遠的革命正在悄然上演。那就是 ARM 處理器,正不聲不響地蠶食著 Intel 和 AMD 在 數據處理單元 (DPU) 市場的市佔率。但這場好戲還沒落幕,因為一個新的挑戰者——RISC-V——正蓄勢待發,準備在這塊關鍵的數據中心領域開闢新天地!

DPU:數據中心的「水電工」與「大腦助手」

到底什麼是 DPU 呢?它還有個別名叫做 SmartNIC(智慧網卡)。簡單來說,DPU 就是數據中心的「管道管理員」,扮演著非常關鍵且複雜的角色。它們的工作是為了減輕主 CPU 的負擔,讓寶貴的 CPU 核心能夠專注於更重要的應用程式運算。DPU 負責處理:

  • 網路負載: 管理資料封包處理、TCP/IP 協定以及 RDMA(遠端直接記憶體存取),確保網路高效且低延遲地運作。
  • 儲存服務: 提供資料壓縮、加密,以及 NVMe-over-Fabrics (NVMe-oF) 等高速儲存解決方案,讓資料存取快如閃電。
  • 安全隔離: 在多租戶的雲端環境中,安全是重中之重。DPU 負責強制執行安全隔離,為不同的用戶或應用程式之間築起一道道堅不可摧的防火牆,防範潛在的威脅。
  • 協調任務: 許多原本會耗費 CPU 週期去執行的協調管理任務,現在都交由 DPU 來處理,這大大提升了整體系統的效率。

DPU 就像是數據中心的「幕後英雄」,默默地確保所有資料流動順暢、安全,而且效率極高。沒有它們,數據中心可能會因為資料處理的瓶頸而寸步難行。

ARM 的崛起:為何能主導 DPU 市場?

眼尖的讀者可能已經發現,目前市場上主要的 DPU 供應商,例如 NVIDIA(透過 Mellanox 開發的 BlueField 系列)、Marvell(OCTEON 系列)、AMD(Pensando)以及 Broadcom,在它們的 DPU 產品中幾乎都採用了 ARM 核心。這並非巧合,而是有其深層的原因:

  • 體積小巧: ARM 核心設計精巧,可以整合到有限的晶片空間中。
  • 功耗極低: 在對能源效率要求極高的數據中心裡,ARM 的低功耗特性使其成為理想選擇。
  • 可授權模式: ARM 的商業模式允許各家晶片設計公司靈活地授權其核心IP,並進行客製化。
  • 既有生態: ARM 核心早已廣泛應用於各種網路晶片中,形成了成熟的生態系統。

當 Intel 雄心勃勃地推出其基礎設施處理單元 (IPU) 計畫時,ARM 實際上已經在 DPU 的整個生態系統中站穩了腳跟,並且制定了事實上的標準。這種「先發優勢」讓 ARM 在 DPU 領域佔據了絕對的領先地位。

市場背景:為何 DPU 市場現在如此火熱?

全球 數據處理單元 (DPU) 市場 正以驚人的速度擴張!根據 Dataintelo Consulting Pvt. Ltd. 在 2024 年的報告指出,預計市場規模將從 2023 年的 15 億美元,一路飆升至 2032 年的約 98 億美元,年複合成長率 (CAGR) 高達 22.8%!Dataintelo 將這股成長動能歸因於資料生成的爆炸性成長,以及各行各業對高效能資料管理與處理解決方案的殷切需求。目前,如前所述,ARM 核心 幾乎壟斷了 DPU 的出貨量,而 Intel 的 IPU 儘管持續推廣,但尚未獲得廣泛的市場青睞。

與此同時,另一個開放指令集架構 RISC-V 也在鄰近的領域展現強勁的發展勢頭。例如,來自首爾的 Fadu 等公司將 RISC-V 核心整合到其企業級 SSD 控制器中,用於 I/O 調度及延遲優化;SiFive 也利用 RISC-V 來加速 I/O。此外,在協調和安全處理器方面,輕量級的 RISC-V 設計也頻繁被採用,例如知名的 OpenTitan 計畫。這些應用與 DPU 的功能角色有著天然的關聯性。

更重要的是,地緣政治因素也為市場多元化推波助瀾:特別是中國正加速自主採用 RISC-V,而 DPU 正是這種關乎國家主權至關重要的基礎設施組件。市場的快速擴張、ARM 的既有優勢,以及超大規模資料中心業者對架構替代方案的渴望,共同為 RISC-V 進入 DPU 市場奠定了堅實的基礎。

RISC-V 在 DPU 中的巨大機會

那麼,RISC-V 為何能在此時脫穎而出,挑戰 ARM 的霸主地位呢?關鍵在於其獨特的優勢:

* 開放指令集架構 (Open ISA):與 ARM 不同,RISC-V 提供的是一個完全開放的指令集架構,企業可以根據其特定的工作負載進行高度客製化 (Wevolver, 2023)。這對於整合了多種功能模組的 DPU 而言尤其重要,例如:
* 用於資料封包流的網路引擎
* 用於壓縮和 NVMe-oF 的儲存加速器
* 用於隔離的安全模組
* 以及用於協調的控制平面 CPU

RISC-V 允許供應商使用自訂指令來適應這些不同的角色,而無需依賴 ARM 固定且預設的開發路線圖。

* 技術創新與彈性:
* 高度客製化: 供應商能夠針對特定工作負載精確調整指令集,這為 DPU 的性能優化提供了前所未有的彈性。
* 同步多執行緒 (SMT): 一些 RISC-V 供應商(例如 Akeana)已經支援每個核心最多四個執行緒的同步多執行緒技術 (Electronics360, 2024),這顯著提高了處理網路和資料包等高記憶體或 I/O 延遲工作負載的吞吐量和利用率。
* 向量擴展: 最新的 RISC-V 向量擴展能夠自然地映射到資料包處理、加密和儲存加速等任務。
* 矩陣擴展: 新興的矩陣擴展則將可編程性擴展到 AI 推理和安全領域。例如,新創公司 Simplex Micro 的架構,在一個時間調度框架內整合了標量、向量和矩陣執行,利用 RISC-V 的可擴展性,在各種 AI 和高效能運算 (HPC) 工作負載中提供確定性的性能。

* 經濟與生態優勢: RISC-V 避免了 ARM 的專利費用,大幅降低了晶片設計和製造成本。同時,它保持了與 Linux、TensorFlow 和 PyTorch 等主流開源堆疊的完美相容性,這讓開發者能夠輕鬆融入現有的生態系統。

從標量到向量再到矩陣:RISC-V 的完整 DPU 路線圖

RISC-V 之所以引人注目,不僅僅是因為另一個 IP 供應商的宣傳,更在於 RISC-V 本身發展的獨特方式。該指令集架構最初是為標量運算而生,為微控制器、嵌入式系統和支援 Linux 的簡單處理器提供小型、高效的核心。

在過去幾年中,RISC-V 穩步增加了向量擴展,實現了資料並行加速,並自然地映射到網路、儲存和加密等工作負載。最近,其路線圖已擴展到包含矩陣擴展,旨在將 AI 推理和其他矩陣數學密集型任務整合到同一指令集架構框架內。

這種「從標量到向量再到矩陣」的演進路徑,完美地契合了 DPU 的性能要求。一個 DPU 必須處理:

  • 標量: 用於控制平面的邏輯運算。
  • 向量: 可向量化的資料包和加密流。
  • 矩陣: 日益增長的面向矩陣的遙測和安全推理任務。

換句話說,RISC-V 的路線圖為真正可編程的 DPU 提供了完整且強大的要素集。

重新定義 DPU:RISC-V 的戰略影響

問題不再只是 RISC-V 能否取代 ARM,而是在於它能否「擴展」或「重新定義」 DPU 的範疇。目前 ARM 在 DPU 領域的主導地位,很大程度上依賴於其標量核心加上固定功能的加速器。而 RISC-V 透過將標量、向量和矩陣的可編程性融合到一個統一的平台中,提供了一條跨越式發展的途徑。

這不一定是以犧牲 ARM 為代價,事實上,ARM 甚至可以考慮採用 RISC-V 的向量和矩陣擴展,以鞏固其在 DPU 領域的地位。但對於更廣泛的產業而言,RISC-V 在 DPU 領域的崛起提供了一個難得的機會來重塑競爭格局。企業不再受制於 ARM 的許可模式,而是可以根據自身需求調整架構。這對於希望優化功耗、性能和實現自主權的超大規模資料中心業者來說尤其重要。

RISC-V 還能有效避免市場出現壟斷局面:與其由單一供應商主導產品路線圖,不如建立一個開放的生態系統,從而孕育出多條發展路徑 (SiFive, 2023)。借助 RISC-V,像高通(Qualcomm)或任何主要的供應商都將佔據主導地位,能夠設計針對其 DPU 架構優化的獨特定制 CPU,而無需依賴 ARM 的許可條款和路線圖。隨著 DPU 成為數據中心基礎設施的核心,這種獨立性可能成為關鍵的差異化因素。

結論:新戰線,而非舊戰場

時機已然成熟。AI 驅動的數據中心架構正在蓬勃發展,DPU 不再僅僅用於網路,更是用於協調計算、儲存和 AI 流程的關鍵樞紐。在這個新世界中,結合了標量、向量和矩陣可編程性的 DPU,顯然比僅整合標量 ARM 核心和固定功能引擎的 DPU 更具吸引力。

正如當年 ARM 發現並利用 DPU 的機會超越了 Intel 和 AMD 一樣,RISC-V 現在也提供了重新定義這一類別的機會。供應商們不需要在 GPU 領域與 NVIDIA 正面交鋒,也不需要試圖重振傳統 CPU,而是可以借助可編程的 DPU 平台實現跨越式發展,從而重塑整個數據中心基礎設施。這將是一個全新的「東山再起」故事——不是重複舊的戰鬥,而是開闢新的戰線,帶來更豐富的 異構運算 可能性。

最終,ARM 和 RISC-V 可能會在 DPU 領域共存,ARM 保持其既有優勢,而 RISC-V 則提供開放、可客製化的替代方案。隨著市場的成熟,這將為供應商和超大規模資料中心提供更多元化的架構選擇,推動數據中心技術持續創新!

引用資料來源:

  • Dataintelo Consulting Pvt. Ltd. (2024). Global Data Processing Unit (DPU) Market.
  • Wevolver. (2023). RISC-V vs. ARM.
  • Marvell. (2023). OCTEON 10 Technical White Paper.
  • Electronics360. (2024). Akeana supports SMT.
  • SiFive. (2023). Benefits of an open ecosystem.

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *