網路議題

如何善用大型語言模型,不讓銀彈人盡皆墜

大型語言模型在商業領域的影響近年來大型語言模型(LLM)已成為人工智慧領域的焦點。微軟、亞馬遜和 Google 等巨頭公司正在為 AI 的主導地位展開全面的「AI 軍備競賽」,企業也在為了不被落後或錯失巨大機會而匆忙轉型。受風險投資商的支援,以 LLM 為動力的新公司如雨後春筍般湧現。然而每種新技術 .... (往下繼續閱讀)

分享到 Facebook 分享到 Line 分享到 Twitter

文章目錄

如何善用大型語言模型,不讓銀彈人盡皆墜

大型語言模型在商業領域的影響

近年來大型語言模型(LLM)已成為人工智慧領域的焦點。微軟、亞馬遜和 Google 等巨頭公司正在為 AI 的主導地位展開全面的「AI 軍備競賽」,企業也在為了不被落後或錯失巨大機會而匆忙轉型。受風險投資商的支援,以 LLM 為動力的新公司如雨後春筍般湧現。然而每種新技術都伴隨著挑戰。模型的真實性和偏見以及訓練成本成為了當前的熱門話題。而與模型的誤用相關的身份和安全問題也開始成為新聞頭條。除此之外,還有一個需要更多關注的問題:在生產環境中執行這些大型模型的成本(推論成本)對創新構成了重大威脅。

執行成本對創新的威脅

相對於其他種類的機器學習模型,生成模型特別大、複雜且計算密集,因此其執行成本要高得多。比如,假設你開發了一款家居裝飾應用程式,可以幫助客戶在不同的設計風格中預覽房間效果。只需要進行一些微調,Stable Diffusion 模型就可以輕鬆實現這一功能。然而你選擇的服務每張圖片收費 1.5 美元,聽起來可能不多,但如果應用程式火爆起來呢?假設你有 100 萬個每天活躍的使用者,每個人生成 10 張圖片,那麼你的推論成本將達到 540 萬美元每年。

如果你是一家將生成模型或 LLM 作為應用程式核心的公司,你的定價結構、增長計劃和商業模式都必須考慮到這些成本。到 AI 應用程式推出的時候,訓練成本已經基本上成了不可逆轉的成本,而推論成本卻是永遠存在的。很多公司已經開始執行這些模型,但要長期維持這些成本將變得越來越困難。然而專有模型在短期內取得了巨大的進展,但它們不是唯一的選擇。開源模型在靈活性、效能和成本節省方面也表現出了巨大的潛力,並且對於許多新興公司來說可能是一個可行的選擇。

混合世界:開源和專有模型同樣重要

毫無疑問,我們在專有模型領域的發展已經相當驚人。在過去幾個月中,我們看到 OpenAI 和微軟推出了 GPT-4、Bing Chat 和無盡的外掛。Google 也推出了 Bard。這個領域的進展令人印象深刻。然而與普遍看法相反,我認為生成 AI 不是一場「贏者通喫」的遊戲。事實上這些模型雖然具有創新性,但它們只是觸及到了潛力的一角。最有趣的創新尚未到來,它將來自於開源社區。

就像我們在軟體領域中所看到的那樣,我們已經到達了一個企業採用混合方法的時刻,根據需要使用專有模型和開源模型。已經有證據表明,開源將在生成 AI 的普及中起到重要作用。例如,Meta 推出了新的 LLaMA 2,它是最新、最強大的模型。還有 LLaMA,這是一個強大但體積較小的模型,可以進行適量的重新訓練(約 8 萬美元),調整協商成本約為 600 美元。你可以在任何地方執行這個模型,甚至可以在 Macbook Pro、智慧手機或樹莓派上執行。與此同時 Cerebras 推出了一系列模型,Databricks 推出了名為 Dolly 的開源模型,類似於 ChatGPT,同樣具有靈活性和價格低廉。

模型、成本和開源的力量

之所以開源模型開始蓬勃發展,是因為它們具有靈活性,可以在具有適當工具的任何硬體上執行。而專有封閉的模型並不能提供這種程度的靈活性和控制權。這一切都發生得非常迅速,而且這只是個開始。我們從開源軟體社區學到了很多寶貴的經驗。如果我們可以讓 AI 模型成為公開可存取的,我們就可以更好地推動創新。我們可以培養一個全球的開發者、研究者和創新者社群,共同貢獻、改進和定制模型,造福人類。如果我們能實現這一點,開發者將有能力選擇適合他們特定需求的模型,無論是開源模型、現成模型還是定制模型。在這個世界中,可能性是無窮的。

Learning-大型語言模型,銀彈,使用技巧,最佳實踐,模型應用,自然語言處理,機器
程宇肖

程宇肖

Reporter

大家好!我是程宇肖,我對於科技的發展和應用有著濃厚的興趣,並致力於將最新的科技趨勢和創新帶給大家。科技領域的變化速度驚人,每天都有令人興奮的新發現和突破。作為一名部落格作者,我將帶領大家深入探索科技的奧秘和應用的無限可能。