
大型語言模型在商業領域的影響
近年來大型語言模型(LLM)已成為人工智慧領域的焦點。微軟、亞馬遜和 Google 等巨頭公司正在為 AI 的主導地位展開全面的「AI 軍備競賽」,企業也在為了不被落後或錯失巨大機會而匆忙轉型。受風險投資商的支援,以 LLM 為動力的新公司如雨後春筍般湧現。然而每種新技術都伴隨著挑戰。模型的真實性和偏見以及訓練成本成為了當前的熱門話題。而與模型的誤用相關的身份和安全問題也開始成為新聞頭條。除此之外,還有一個需要更多關注的問題:在生產環境中執行這些大型模型的成本(推論成本)對創新構成了重大威脅。
執行成本對創新的威脅
相對於其他種類的機器學習模型,生成模型特別大、複雜且計算密集,因此其執行成本要高得多。比如,假設你開發了一款家居裝飾應用程式,可以幫助客戶在不同的設計風格中預覽房間效果。只需要進行一些微調,Stable Diffusion 模型就可以輕鬆實現這一功能。然而你選擇的服務每張圖片收費 1.5 美元,聽起來可能不多,但如果應用程式火爆起來呢?假設你有 100 萬個每天活躍的使用者,每個人生成 10 張圖片,那麼你的推論成本將達到 540 萬美元每年。
如果你是一家將生成模型或 LLM 作為應用程式核心的公司,你的定價結構、增長計劃和商業模式都必須考慮到這些成本。到 AI 應用程式推出的時候,訓練成本已經基本上成了不可逆轉的成本,而推論成本卻是永遠存在的。很多公司已經開始執行這些模型,但要長期維持這些成本將變得越來越困難。然而專有模型在短期內取得了巨大的進展,但它們不是唯一的選擇。開源模型在靈活性、效能和成本節省方面也表現出了巨大的潛力,並且對於許多新興公司來說可能是一個可行的選擇。
混合世界:開源和專有模型同樣重要
毫無疑問,我們在專有模型領域的發展已經相當驚人。在過去幾個月中,我們看到 OpenAI 和微軟推出了 GPT-4、Bing Chat 和無盡的外掛。Google 也推出了 Bard。這個領域的進展令人印象深刻。然而與普遍看法相反,我認為生成 AI 不是一場「贏者通喫」的遊戲。事實上這些模型雖然具有創新性,但它們只是觸及到了潛力的一角。最有趣的創新尚未到來,它將來自於開源社區。
就像我們在軟體領域中所看到的那樣,我們已經到達了一個企業採用混合方法的時刻,根據需要使用專有模型和開源模型。已經有證據表明,開源將在生成 AI 的普及中起到重要作用。例如,Meta 推出了新的 LLaMA 2,它是最新、最強大的模型。還有 LLaMA,這是一個強大但體積較小的模型,可以進行適量的重新訓練(約 8 萬美元),調整協商成本約為 600 美元。你可以在任何地方執行這個模型,甚至可以在 Macbook Pro、智慧手機或樹莓派上執行。與此同時 Cerebras 推出了一系列模型,Databricks 推出了名為 Dolly 的開源模型,類似於 ChatGPT,同樣具有靈活性和價格低廉。
模型、成本和開源的力量
之所以開源模型開始蓬勃發展,是因為它們具有靈活性,可以在具有適當工具的任何硬體上執行。而專有封閉的模型並不能提供這種程度的靈活性和控制權。這一切都發生得非常迅速,而且這只是個開始。我們從開源軟體社區學到了很多寶貴的經驗。如果我們可以讓 AI 模型成為公開可存取的,我們就可以更好地推動創新。我們可以培養一個全球的開發者、研究者和創新者社群,共同貢獻、改進和定制模型,造福人類。如果我們能實現這一點,開發者將有能力選擇適合他們特定需求的模型,無論是開源模型、現成模型還是定制模型。在這個世界中,可能性是無窮的。
延伸閱讀
- OpenAI 重磅推出 GPT-4.5:歷史上最大的語言模型來了!
- OpenAI 努力破解 ChatGPT 的約束,帶你進入無阻礙的對話世界!
- 粉紅魚助力企業打造 AI 代理人!揭開自然語言處理的背後祕密
- 深入探索 DeepSeek:您需要理解的 AI 聊天機器人應用程式的全部資訊!
- 《徹底解析 ChatGPT:你必須知道的 AI 聊天機器人一切!》
- OpenAI AI 推理模型竟然會「用中文思考」,背後原因成謎!
- 探索 ChatGPT:你所需理解的一切關於這款 AI 聊天機器人!
- 「DeepSeek 最新 AI 模型為何自認是 ChatGPT?揭祕背後的技術奧妙!」
- 全方位解析:你必須認識的智慧型聊天機器人 ChatGPT!
- 「Linkup:合法串接大型語言模型與頂級內容來源的全新突破!」