
Meta 公佈開源 AI 模型 LLaMA 2,將改變大型語言模型布局
在與微軟 Inspire 大會同步舉行的重大公告中,Meta 宣布推出其全新的 AI 模型 LLaMA 2(Large Language Model Meta AI)。這款全新的大型語言模型(LLM)不僅已經上市,而且是開源的,可以免費供商業用途使用,這在第一代 LLaMA 模型中是不可能的,該模型只有用於研究目的的授權。這一訊息的重要性在於,微軟公開支援 LLaMA 2,使得快速發展的生成 AI 領域再次發生了變動。現在那些匆忙、雖然謹慎地追求 AI 的企業有了另一個選擇,而且這個選擇完全免費,與領導者和競爭對手 OpenAI 的 ChatGPT Plus 或 Cohere 不同。
積極開源策略
Meta 將 LLaMA 2 模型提供給微軟 Azure 平臺使用,這對於 OpenAI 及其 GPT-3/GPT-4 模型系列而言是一個值得注意的舉動。微軟既是 Meta 前身 Facebook 的投資者,又是 OpenAI 的投資者。Meta 的創始人兼執行長馬克·扎克伯格對於 LLaMA 的開源表示熱切的支援。扎克伯格在一份宣告中指出,Meta 在開源方面有著悠久的歷史,並且在 AI 領域特別是 PyTorch 機器學習框架方面做出了許多傑出貢獻。扎克伯格表示:“開源推動創新,因為它讓更多開發者能夠使用新技術。它也改進了安全性,因為當軟體是開源的時,更多人可以審查它,以發現和修復潛在問題。我相信,如果生態系統更加開放,將能夠實現更多的進步,這就是為什麼我們要開源 LLaMA 2 的原因。”Meta 的副總裁兼首席 AI 科學家雅恩·勒孔(Yann LeCun)在 Twitter 上也對此次開源的發布表示讚揚。勒孔寫道:“這是一個巨大的變革:LLaMA 2 是開源的,並且授權使用!這將改變大型語言模型市場的格局。LLaMA 2 在 Microsoft Azure 上可用,並將在 AWS、Hugging Face 和其他平臺上可用。”
LLaMA 的特點
LLaMA 是基於 Transformer 的自回歸語言模型。Meta 在二月份公開詳細介紹了 LLaMA 的第一代模型,該模型有 650 億個引數,能夠處理各種常見的生成 AI 任務。相比之下,LLaMA 2 有多個模型尺寸,包括 7、13 和 700 億個引數。Meta 稱,這些預訓練模型是在比 LLaMA 1 使用的資料集大 40%的巨大資料集上進行的。上下文長度也擴大了,達到了比 LLaMA 1 兩倍的兩萬億個詞元。根據 Meta 提供的基準測試結果,LLaMA 2 不僅在資料集上訓練更多的資料和更多的引數,而且在效能上也優於前作。
安全措施的重要性
LLaMA 2 不僅僅是一個強大的模型,它也注重安全性。LLaMA 2 首先用公開可得的資料進行預訓練,然後進行一系列的監督細調(SFT)階段。作為一種附加層,LLaMA 2 還經過一個人類反饋的強化學習迴圈(RLHF),以提供更高的安全性和負責任性。Meta 關於 LLaMA 2 的研究論文詳細介紹了為提供安全性和約束潛在偏見所採取的全面措施。論文中提到:“理解預訓練資料的內容對於增加透明度、揭示潛在問題的根本原因(如潛在的偏見)等是非常重要的。這可以指導適當的模型使用,並幫助設計相應的減輕措施。”
VentureBeat 的使命是成為技術決策者獲取有關企業轉型技術和進行交易的數位集市。探索我們的內容,獲取相關訊息。
關鍵詞:AI, Meta, LLaMA 2, 開源, AI 模型, 商業用途, Meta, Facebook
延伸閱讀
- 震撼!Meta 新添 Stripe CEO 及金融界重量級人物加入董事會
- Google 攜手 Anthropic 推出全新 AI 模型存取資料標準,革命性進展即將改變科技界!
- 「Inception 首度曝光!全新 AI 模型顛覆科技界!」
- 《Anthropic 利用寶可夢測試最新 AI 模型,成果驚人!》
- Meta 員工探討使用版權內容進行 AI 訓練,背後隱祕曝光!
- Meta 在印度擴張:即便裁員潮來襲,科技巨頭仍然看好市場潛力!
- Meta 暫停書籍授權以進行 AI 訓練,背後原因揭曉!
- Meta 的新戰略布局:進軍類人機器人領域!
- Meta 宣布「水域計畫」,全球 5 萬公裏海底電纜工程重磅揭幕!
- 「Meta 技術長:若不滿新政策,員工應該考慮辭職!」