Nvidia's Next-Gen Blackwell Platform Coming to Google Cloud in 2025
本週在拉斯維加斯舉行的 Google Cloud Next 意味著多個新的實例型別和加速器即將登陸 Google Cloud 平臺。除了新的定製 Arm 架構 Axion 晶片之外,今年的大部分公告都涉及人工智慧(AI)加速器,無論是由 Google 自家研發還是來自 Nvidia。
Nvidia Blackwell 平臺
僅僅幾週前,Nvidia 宣布了其 Blackwell 平臺。但別指望 Google 會很快提供這些機器。對於 AI 和高效能運算(HPC)工作負載的高效能 Nvidia HGX B200 和用於大語言模型(LLM)訓練的 GB200 NBL72 的支援將於 2025 年初推出。值得一提的是,GB200 伺服器將使用液冷技術。
Google 的反應
對於需要更多計算能力來訓練 LLMs 的開發者來說 Google 也宣布了 A3 Mega 實例。該實例由 Google 與 Nvidia 合作開發,配備行業標準的 H100 GPU,並結合了一個新的網路系統,可以每個 GPU 提供多達兩倍的頻寬。另一個新的 A3 實例是 A3 confidential,Google 表示此實例可幫助客戶在訓練和推斷期間“更好地保護敏感資料和 AI 工作負載的機密性和完整性”。
Google 自家晶片
Google 在本週二推出了其 Cloud TPU v5p 處理器,這是其自家 AI 加速器中效能最強大的一款,現已普及。這些晶片的浮點運算每秒提升了 2 倍,記憶體頻寬速度提升了 3 倍。與這些快速晶片相應的還有新的人工智慧最佳化儲存選項。Hyperdisk ML 是該公司的下一代區塊儲存服務,當前處於預覽階段,能提高模型載入時間多達 3.7 倍。
GoogleCloud 的新實例
GoogleCloud 還將推出由英特爾第四代和第五代至強處理器驅動的多個傳統實例。例如,全新的通用 C4 和 N4 實例將搭載第五代 Emerald Rapids 至強處理器,其中 C4 注重效能,而 N4 則著重價格。此外還有新的 C3 裸金屬機器,由舊的第四代英特爾至強處理器驅動,X4 記憶體最佳化裸金屬實例等。
技術和產業影響
技術趨勢與挑戰
隨著 Nvidia Blackwell 平臺在 2025 年初進入 Google Cloud,人工智慧和高效能計算領域將迎來更多的革新。然而這也帶來了新的挑戰,例如如何充分利用這些高效能的硬體來推動更複雜的應用程式以及如何保障資料的安全性與私隱性。
資料安全與隱私
對於 GoogleCloud 上的使用者來說新的 A3 confidential 實例提供了更好的資料隱私和完整性保障。加密計算服務能夠在訓練和推斷期間加密資料傳輸,不需要進行程式碼更改,這對於保護敏感資料和 AI 工作負載至關重要。
產業應用與推動
人工智慧在各行各業中的應用越來越廣泛,新的 AI 加速器和基於 Nvidia Blackwell 平臺的機器將有望為企業和開發者提供更多工具和資源,從而推動更多創新應用的實現。
總結
這些技術新聞給業界帶來了新的展望,同時也凸顯出了在快速發展的技術市場中維持競爭優勢的挑戰。無論是硬體還是軟體,科技公司和使用者都應該注重資源的有效利用和資料隱私的保護,以實現更穩健和可持續的技術發展。
延伸閱讀
- 基於人工智慧時代,Anon 正在打造自動化認證層 - 技術新聞
- Uber 和 Nvidia 支援的 Serve Robotics 以 4,000 萬美元的鉅額進軍公開市場
- Nvidia 挑起 AI 晶片新創公司的投資風暴,Hailo 仍堅守戰場
- 海洛科技獲得 1.2 億美元融資,持續與 Nvidia 角力,在多數 AI 晶片新創公司陷入困境的情況下
- Nvidia 或成下一個 AWS 霸主?
- 技術新聞:Gitai 的自主機器人在國際太空站外安裝太陽能板,體現軌道修復的實際操作
- Nvidia 攜手人形機器人頂尖品牌打造全新 AI 平臺「GR00T」
- Nvidia GTC 2024:AI 世界齊聚的關鍵活動
- Aethero 想要成為太空產業的英特爾或 Nvidia
- Nanonets 獲得 Accel India 支援,以改進基於人工智慧的工作流程自動化