## 如何確保新創公司成功部署大型語言模型(LLM)
### 初探 LLM 的優勢
Lu Zhang 是 Fusion Fund 的創始人兼董事長,他在健康醫療領域是著名的矽谷投資者和連續創業家。ChatGPT 的推出開啟了大型語言模型的時代。除了 OpenAI 的產品之外,其他 LLM 還包括 Google 的 LaMDA 系列(包括 Bard)、BLOOM 計畫(由 Microsoft、Nvidia 和其他組織合作)、Meta 的 LLaMA 以及 Anthropic 的 Claude。未來將不乏新的 LLM 誕生。事實上 2023 年 4 月的一份 Arize 調查發現,53%的受訪者計劃在未來一年內或更早部署 LLM。
一種有效的方法是建立一個“垂直”LLM,即以現有的 LLM 為基礎,並仔細對特定領域的知識加以重新訓練。這種策略對生命科學、製藥、保險、金融等行業都是可行的。部署 LLM 可以提供強大的競爭優勢,但前提是必須做得好。LLM 已經引發了一些引人注目的問題,例如它們有時會“幻覺”出不正確的訊息。這是一個嚴重的問題,並且可能會分散領導層的注意力,使他們忽視產生這些輸出的過程中存在的重要問題,這同樣可能是有害的。
### 訓練和部署 LLM 的挑戰
使用 LLM 的一個問題是它們極高的運算成本,因為訓練和執行它們需要非常大的計算量(它們不是大型語言模型的名稱而已)。LLM 確實令人振奮,但要開發和採用它們需要克服幾個可行性障礙。首先執行模型所需的硬體成本高昂。Nvidia 的 H100 GPU 是一個熱門的 LLM 選擇,它在二手市場上的售價約為每塊 40,000 美元。一個訊息來源估計,訓練一個與 ChatGPT-3.5 相當的 LLM 可能需要大約 6,000 塊這樣的晶片,僅 GPU 的成本就大約為 2.4 億美元。另一個重要的支出是為這些晶片提供電力。僅僅訓練一個模型據估計需要約 10 億瓦時的電力,相當於 1000 個美國家庭一年的用電量。一旦模型訓練完成,它的電費將有所不同,但可能會變得極高。一個訊息來源估計,執行 ChatGPT-3.5 所需的功耗約為每天 1 億瓦時,相當於 3.3 萬個家庭的日常用電量。在便攜裝置上執行 LLM 時,電力消耗也可能成為潛在的問題。這是因為在裝置上大量使用 LLM 可能會導致電池電量迅速耗盡,這將是消費者採用的一個重大障礙。
### 思考與建議
在部署 LLM 時,新創公司應該考慮幾個步驟來確保成功。首先他們應該評估他們的業務需求,確保 LLM 是否確實是必需的。其次新創公司應該謹慎分析 LLM 的運算成本,考慮這一投資是否符合其長期發展策略。另外新創公司應該積極尋求專業的技術支援,這將有助於避免一些在 LLM 部署過程中的技術挑戰。此外合適的培訓和指導將有助於公司內部團隊更好地理解和使用 LLM。最後新創公司應該警惕 LLM 可能引發的風險,並制定應對計劃以應對可能的問題。
透過認真考慮這些建議,新創公司便有機會成功部署 LLM,並從中受益。這不僅將提高他們的競爭力,還將有助於推動產業的創新發展。
Startup-新創公司,成功部署,LLM,步驟,確保
延伸閱讀
- 你的 AI 原生新創公司並非一般的 SaaS 公司
- Dropbox、Figma CEO 支援 Lamini:新創公司打造企業專用生成式人工智慧平臺
- ButcherBox 收購「Shark Tank」亮相的新創公司 Truffle Shuffle
- 花旗集團的風險投資部門投資於 API 安全新創公司 Traceable
- 「馬斯克的 xAI 示範 AI 新創公司的龐大市場潛力」
- 衣索比亞塑膠再生新創公司 Kubik 獲得新一輪融資,計畫授權其技術
- 針對 Stripe 的重大改變,巴西最新的金融科技獨角獸和一個新創公司關閉的故事
- 倫敦首次舉辦防禦科技駭客松 將烏克蘭戰爭帶到城市的新創公司
- 抖音禁令對創作者經濟新創公司是否會產生影響?創辦人們表示影響並不大
- FTC 禁止競爭約束條款可能對新創公司有益,但也可能被推翻