網路議題

如何善用大型語言模型，不讓銀彈人盡皆墜

大型語言模型在商業領域的影響近年來大型語言模型（LLM）已成為人工智慧領域的焦點。微軟、亞馬遜和 Google 等巨頭公司正在為 AI 的主導地位展開全面的「AI 軍備競賽」，企業也在為了不被落後或錯失巨大機會而匆忙轉型。受風險投資商的支援，以 LLM 為動力的新公司如雨後春筍般湧現。然而每種新技術 .... (往下繼續閱讀)

by 程宇肖
2023/8/6
6 分鐘閱讀時間

A- A A+

文章目錄

大型語言模型在商業領域的影響

近年來大型語言模型（LLM）已成為人工智慧領域的焦點。微軟、亞馬遜和 Google 等巨頭公司正在為 AI 的主導地位展開全面的「AI 軍備競賽」，企業也在為了不被落後或錯失巨大機會而匆忙轉型。受風險投資商的支援，以 LLM 為動力的新公司如雨後春筍般湧現。然而每種新技術都伴隨著挑戰。模型的真實性和偏見以及訓練成本成為了當前的熱門話題。而與模型的誤用相關的身份和安全問題也開始成為新聞頭條。除此之外，還有一個需要更多關注的問題：在生產環境中執行這些大型模型的成本（推論成本）對創新構成了重大威脅。

執行成本對創新的威脅

相對於其他種類的機器學習模型，生成模型特別大、複雜且計算密集，因此其執行成本要高得多。比如，假設你開發了一款家居裝飾應用程式，可以幫助客戶在不同的設計風格中預覽房間效果。只需要進行一些微調，Stable Diffusion 模型就可以輕鬆實現這一功能。然而你選擇的服務每張圖片收費 1.5 美元，聽起來可能不多，但如果應用程式火爆起來呢？假設你有 100 萬個每天活躍的使用者，每個人生成 10 張圖片，那麼你的推論成本將達到 540 萬美元每年。

如果你是一家將生成模型或 LLM 作為應用程式核心的公司，你的定價結構、增長計劃和商業模式都必須考慮到這些成本。到 AI 應用程式推出的時候，訓練成本已經基本上成了不可逆轉的成本，而推論成本卻是永遠存在的。很多公司已經開始執行這些模型，但要長期維持這些成本將變得越來越困難。然而專有模型在短期內取得了巨大的進展，但它們不是唯一的選擇。開源模型在靈活性、效能和成本節省方面也表現出了巨大的潛力，並且對於許多新興公司來說可能是一個可行的選擇。

混合世界：開源和專有模型同樣重要

毫無疑問，我們在專有模型領域的發展已經相當驚人。在過去幾個月中，我們看到 OpenAI 和微軟推出了 GPT-4、Bing Chat 和無盡的外掛。Google 也推出了 Bard。這個領域的進展令人印象深刻。然而與普遍看法相反，我認為生成 AI 不是一場「贏者通喫」的遊戲。事實上這些模型雖然具有創新性，但它們只是觸及到了潛力的一角。最有趣的創新尚未到來，它將來自於開源社區。

就像我們在軟體領域中所看到的那樣，我們已經到達了一個企業採用混合方法的時刻，根據需要使用專有模型和開源模型。已經有證據表明，開源將在生成 AI 的普及中起到重要作用。例如，Meta 推出了新的 LLaMA 2，它是最新、最強大的模型。還有 LLaMA，這是一個強大但體積較小的模型，可以進行適量的重新訓練（約 8 萬美元），調整協商成本約為 600 美元。你可以在任何地方執行這個模型，甚至可以在 Macbook Pro、智慧手機或樹莓派上執行。與此同時 Cerebras 推出了一系列模型，Databricks 推出了名為 Dolly 的開源模型，類似於 ChatGPT，同樣具有靈活性和價格低廉。

模型、成本和開源的力量

之所以開源模型開始蓬勃發展，是因為它們具有靈活性，可以在具有適當工具的任何硬體上執行。而專有封閉的模型並不能提供這種程度的靈活性和控制權。這一切都發生得非常迅速，而且這只是個開始。我們從開源軟體社區學到了很多寶貴的經驗。如果我們可以讓 AI 模型成為公開可存取的，我們就可以更好地推動創新。我們可以培養一個全球的開發者、研究者和創新者社群，共同貢獻、改進和定制模型，造福人類。如果我們能實現這一點，開發者將有能力選擇適合他們特定需求的模型，無論是開源模型、現成模型還是定制模型。在這個世界中，可能性是無窮的。

Learning-大型語言模型,銀彈,使用技巧,最佳實踐,模型應用,自然語言處理,機器

市場觀察

AIGC

Web 3

專案故事

網路議題

產品管理

專案管理

閱讀心得

職涯觀點

日常生活

專案工具

資料收集

如何善用大型語言模型，不讓銀彈人盡皆墜

文章目錄

大型語言模型在商業領域的影響

執行成本對創新的威脅

混合世界：開源和專有模型同樣重要

模型、成本和開源的力量

延伸閱讀

本週 AI 大事榜：實驗、退休與滅絕事件

如何在不耗費大筆金錢的情況下運用大型語言模型

程宇肖