AIGC

如何實現更環保的生成式人工智慧與可持續推論技術

生成式人工智慧：可持續性考量與推論技術的挑戰引言在如今人工智慧越來越普及的趨勢下，我們需要面對人工智慧所帶來的成本和環境影響的審視。生成式人工智慧（generative AI）以驚人的速度和無可辯駁的準確性，可以像人類一樣生成內容、影象、音樂和程式碼，旨在幫助企業提高效率並促進創新。然而生成式人工智 .... (往下繼續閱讀)

by 程宇肖
2023/9/4
11 分鐘閱讀時間

A- A A+

文章目錄

生成式人工智慧：可持續性考量與推論技術的挑戰

引言

在如今人工智慧越來越普及的趨勢下，我們需要面對人工智慧所帶來的成本和環境影響的審視。生成式人工智慧（generative AI）以驚人的速度和無可辯駁的準確性，可以像人類一樣生成內容、影象、音樂和程式碼，旨在幫助企業提高效率並促進創新。然而生成式人工智慧的運算過程中的「推論」（inference）階段是消耗能源最多、成本最高的模型構建實踐。在追求更可持續性的解決方案的同時我們需要在質量和吞吐量之間取得平衡。

生成式人工智慧的執行方式

對於不熟悉機器學習（machine learning）的人來說很難想像人工智慧和底層演算法如何導致如此大的環境和財務負擔。機器學習的過程可以分為兩個階段：訓練模型和推論。

- 第一階段是訓練模型，以發展智慧並將資訊分類。例如，一個電子商務業務可以向模型提供其產品和顧客習慣的影象，以便在後續進一步分析這些資料。

- 第二階段是推論，模型將使用儲存的資訊來理解新資料。舉例來說電子商務業務可以將產品分類為型別、大小、價格、顏色等一系列分類，同時向顧客提供個性化建議。推論階段比兩階段中較少需要運算，但一旦在諸如 Siri 或 Alexa 等平臺上大規模部署，累積的計算可能消耗大量能源，從而增加成本和碳排放。

隱藏成本

作為生成式人工智慧的明星模型，ChatGPT 的推論成本是一個極其昂貴的例子，每天消耗數百萬美元（這還不包括訓練成本）。據估計，OpenAI 最近發布的 GPT-4 所需的計算資源比前一個版本要多三倍，擁有 1,800 億個引數和 16 個專家模型的叢集運算花費了巨大的能源。隨著上下文長度從 8,000 跳躍至 32,000，推論成本增加，讓 GPU 的效率變低。可想而知，只有最大的企業才能擁有資源來大規模應用生成式人工智慧，而其他缺乏必要資源的企業無法充分利用該技術的好處。

生成式人工智慧及其大型語言模型（LLMs）對環境造成嚴重後果。所需的計算能力和能源消耗導致顯著的碳排放。關於一次生成式人工智慧查詢的碳足跡僅有有限的資料，但一些分析師認為它是搜尋引擎查詢的四到五倍。曾有一項估算認為，ChatGPT 的電力消耗相當於 17.5 萬人的消耗。回到 2019 年，麻省理工學院（MIT）發布的研究表明，訓練一個大型人工智慧模型會產生 62.6 萬磅的二氧化碳排放，幾乎是普通車輛整個使用壽命排放的五倍。儘管有一些引人注目的研究和主張，但有關生成式人工智慧和其碳排放的具體資料仍然是一個重大問題，如果我們要推動變革，就必須解決這個問題。同樣，主持生成式人工智慧模型的組織和資料中心也必須積極應對環境影響，透過最佳化成本和能源消耗的效能，將商業利益與約束氣候變化的努力相結合。

計算機的局限性

中央處理器（CPU）是計算機的核心，負責執行指令和數學運算，每秒可處理數百萬條指令。不久前，CPU 是推論的首選硬體。然而近年來人們開始從 CPU 轉向使用附加到 CPU 上並作為讀取引擎的協處理器（也稱為深度學習加速器，DLA），來執行深度學習處理。問題在於主持這些 DLA 的 CPU 嘗試在推論伺服器中處理大量的資料移動以及從其它資料處理任務中獲取輸入資料並處理 DLA 的輸出資料。再一次，作為序列處理元件，CPU 造成瓶頸，無法像所需的那樣高效執行任務。可以把它想像成一輛汽車，只能以引擎允許的速度奔跑，如果將一輛小型轎車的引擎換成跑車的引擎，小型轎車將無法承受較強引擎施加的速度和加速度。同樣的情況也存在於以 CPU 為主導的人工智慧推論系統中，儘管 DLAs，尤其是 GPU，以驚人的速度執行，每秒完成數萬個推論任務，但受限於輸入和輸出量的距離的 CPU 將無法發揮它們的全部潛力。

系統整體解決方案的必要性

正如 NVIDIA CEO 黃仁勳所言，「人工智慧需要從晶片到系統的全面改造」。隨著人工智慧應用和專用硬體加速器（如 GPU 或 TPU）的指數級增長，我們需要關注這些加速器周圍的系統，並建立整體解決方案，以支援所需的資料處理量和速度。我們需要能夠處理大規模人工智慧應用的解決方案，同時以較低的成本和能源投入實現無縫模型遷移。取代以 CPU 為中心的人工智慧推論伺服器是關鍵，它提供了一個高效、可擴充套件且經濟實惠的解決方案，以應對業務中人工智慧需求的迅速增長，同時處理先前提到的環境影響。

民主化的人工智慧

當前行業領袖正在提出許多解決方案，以降低生成式人工智慧的成本，同時保持其浮力和發展方向。以綠色能源為人工智慧供電可能是一條路線；另一個可能是根據可再生能源的供應時間安排計算運算工作。值得考慮的是，在資料中心中引入人工智慧驅動的能源管理系統，從而實現成本節約並改善經營的環境認證。除了這些策略之外，硬體是實現人工智慧的一個重要投資。硬體是所有運算的基石，要承擔能源浪費的計算負擔。一個能夠以更低的財務和能源成本支援所有處理工作的硬體平臺或人工智慧推論伺服器晶片將是具有轉型意義的。這將是實現人工智慧民主化的方式，因為較小型企業可以利用不依賴於大企業資源的人工智慧模型。ChatGPT 等模型每天需耗費數百萬美元的能源，而一個以更少的能量和 GPU 數量執行的替代性單晶片伺服器解決方案將節省資源，減輕世界能源系統的負擔，實現經濟實惠且環境友好的生成式人工智慧，使其成為廣泛可用的技術。

結語

要想在生成式人工智慧的發展中實現可持續發展，我們需要關注推論技術所產生的能源和成本開支。同時我們需要更多關於生成式人工智慧的碳排放資料和環境影響的實證研究，以推動相關變革。進一步促使人工智慧組織和資料中心採取積極措施，透過最佳化計算架構和可持續做法，將商業利益與約束氣候變化的努力相結合。只有透過整體解決方案，並不斷推動著人工智慧硬體的創新，我們才能實現經濟實惠、可持續且普遍可用的生成式人工智慧，促進其民主化的發展。

Sustainability-環保,生成式人工智慧,可持續,推論技術

市場觀察

AIGC

Web 3

專案故事

網路議題

產品管理

專案管理

閱讀心得

職涯觀點

日常生活

專案工具

資料收集