MLPerf 3.0 基準測試揭示人工智慧訓練效能超越摩爾定律
背景
在人工智慧(AI)領域,以生成式人工智慧(generative AI)為代表的應用正受到越來越多人的關注,相應的,支援機器學習(ML)訓練的底層系統的效能也在不斷提高。MLCommons 最近公佈了其 MLPerf 訓練 3.0 基準測試的最新結果,旨在為 ML 模型訓練效能提供一個行業標準的測量標準。MLCommons 是一個開放的工程協會,致力於 ML 基準測試、資料集和最佳實踐,旨在加快 AI 的發展。該組織當前有一系列針對 ML 的基準測試,包括上一次於 2022 年 11 月發布的 MLPerf 訓練 2.1 結果。MLPerf 訓練 3.0 的一個重要新增內容是對大型語言模型(LLMs)進行測試,其中包括從 GPT-3 開始。LLMs 的新增對測試套件來說是至關重要的,因為組織正在構建生成式 AI 技術。ML 訓練在超越摩爾定律的情況下持續加快
從所有結果來看,MLPerf 訓練 3.0 基準測試結果顯示出效能的顯著提升,這表明 ML 訓練的能力正在超越摩爾定律。MLCommons 執行主任大衛·坎特(David Kanter)在新聞簡報中表示:“作為一個行業,摩爾定律是我們前進的指標;這是人們習慣於思考電子產品進步的標尺”。他還指出:“自 2018 年以來,我們在效能方面的進步大約是 30 至 50 倍,這是令人難以置信的,而且比摩爾定律快了 10 倍”。具體來看,過去一年的 MLPerf 訓練資料顯示,所有結果的增長幅度在 5%至 54%之間。ML 訓練加速的原因
ML 訓練持續加快的原因有多個,而且速度超過了摩爾定律的範疇。其中一個主要推動因素是硬體的改進,包括 Nvidia 和 Intel 等業界廠商正在積極最佳化的領域。坎特指出,當 MLPerf 基準測試剛開始時,最先進的矽使用的是 16 奈米工藝。相比之下,如今使用最先進的矽材料已經達到 5 奈米,從而提供更高的密度和效能。 除了硬體,算法和軟體也是使訓練加速的關鍵。廠商和研究人員不斷發展新的高效執行操作方法。此外開發工具鏈的整體改進也起到了重要作用,例如程式碼編譯器。此外擴大系統規模以提供更多的通訊頻寬也是一個重要因素。Nvidia 最近幾年一直在構建其基於 InfiniBand 的存取性,以支援高速通訊頻寬。而 Intel 則一直致力於改善乙太網路以實現更高效能的 ML 操作。測試 LLM 訓練並非易事
將 LLM 訓練基準測試納入 MLCommons 並非易事。GPT-3 是一個擁有 1750 億引數的模型,與之相比,自然語言處理(NLP)模型 BERT 要小得多,只有 3.4 億個引數。坎特表示:“這是我們所有基準測試中計算成本最高的。”即使對於 Nvidia 來說 LLM 基準測試也需要大量的工作才能進行評估。Nvidia 的 AI 基準測試和雲端計算負責人戴夫·薩爾瓦多(Dave Salvator)在一次簡報中解釋說,他的公司與雲平臺提供商 CoreWeave 一起提交了基準測試報告。他們使用多個 MLPerf 訓練 3.0 基準測試的 3484 個 GPU 進行評估。薩爾瓦多指出,CoreWeave 在今年 3 月的 Nvidia GTC 大會上宣布其大型 GPU 實例已經開始提供。他還提到,CoreWeave 成為首家推出 HG H100 實例的供應商。薩爾瓦多表示:“透過這次合作,我們在幾乎所有的工作負載上創造了新的紀錄。同樣有趣的是這個實例是一個真正的商業實例。”MLPerf 基準測試使用的與 CoreWeave HG H100 實例相同,也被初創企業 Inflection AI 使用,該公司開發了自己的個人 AI 品牌 Pi。薩爾瓦多指出,Inflection AI 還協助 Nvidia 和 CoreWeave 對 GPU 實例進行了一些微調。“我們在 MLPerf 的測試結果並不是在虛擬實驗室中獲得的,這是一個實實在在的商業實例,我們有一個名為 Inflection AI 的客戶使用相同的實例進行創新的 LLM 工作並獲得了很好的結果。” 薩爾瓦多說。總結與展望
MLPerf 訓練 3.0 基準測試的結果表明,ML 訓練的效能正在快速提升,超越了摩爾定律所預示的進步速度。這一超越摩爾定律的現象得益於硬體、算法和軟體的不斷改進以及系統規模的增大。在發展 ML 領域時,企業應該密切關注這些技術和趨勢,並適時進行投資,以確保獲得競爭優勢。同時基準測試的引入也為訓練大型語言模型提供了一個衡量標準,使組織能夠更好地評估和改進 AI 技術的效能和效益。 因此無論是硬體廠商還是軟體開發者,都應致力於在 ML 訓練效能方面不斷創新和改進。同時企業需要具備適應快速發展的 ML 技術和工具的能力,以充分利用 ML 訓練的最新成果。只有這樣,企業才能充分發揮 AI 在業務和創新中的潛力,並實現持續的成長和成功。 注:本文參考了新聞源中提供的訊息,並進行整理和解讀。Artificial Intelligence-機器學習,基準測試,MLPerf3.0,LLMs,人工智慧,訓練效能,提
延伸閱讀
- OpenAI 揭開 AI 祕密指令的面紗
- AI 助您創辦者更快、更輕鬆地籌集資金嗎?
- 盧西德機器人獲得 900 萬美元用於無人機清潔任何地方
- 以色列新創公司 Panax 籌集了 1,000 萬美元 A 輪融資,用於其基於人工智慧的現金流管理平臺
- Reddit 測試使用基於 LLM 的人工智慧進行自動整站法語翻譯
- 三星醫聲將以 9270 萬美元收購法國人工智慧超聲波新創公司 Sonio
- 網際網路共同創始人 Robert Kahn 早在幾十年前就已經做到了加密、人工智慧和網際網路嗎?
- 人聲 vs AI:Audible 推出 AI 旁白有機會取代人類旁白嗎?
- 深潛至海底者:機器學習揭開抹香鯨的「字母表」
- 突破獨家訪談:Wayve 共同創辦人 Alex Kendall 談自動駕駛汽車和機器人的未來