Meta 釋出 Llama 3,聲稱是最優秀的開源模型之一
作者:Kyle Wiggers,時間:8 小時前
概述
Meta 最近發布了其 Llama 系列開源生成式人工智慧模型的最新成員:Llama 3。更確切地說,該公司已經在其新的 Llama 3 系列中開源了兩個模型,其他模型的釋出日期尚未確保。Meta 將這些新模型描述為與前代 Llama 模型相比在效能上的一個“重大飛躍”。Llama 3 8B 包含 80 億個引數,而 Llama 3 70B 包含 700 億個引數。Meta 表示就其引數數量而言,Llama 3 8B 和 Llama 3 70B 在透過兩個自定義 24,000 GPU 叢集進行訓練後,如今成為當今最效能卓越的生成式人工智慧模型之一。
支援主張
Meta 指出 Llama 3 模型在 MMLU、ARC、DROP 等多個人工智慧基準測試上的成績表現出色。然而這些基準測試的實用性和有效性仍受到爭議。Meta 還表示 Llama 3 8B 在至少九個基準測試上超越了其他開源模型,包括 Mistral 的 Mistral 7B 和 Google 的 Gemma 7B。此外 Meta 還聲稱,引數更多的 Llama 3 70B 與 Google 的 Gemini 系列等旗艦生成式人工智慧模型競爭力強勁。
訓練資料及資源
Meta 表示 Llama 3 模型使用了龐大的訓練資料,包括了來自 “公開可用來源的” 資料,其中包含 30 多種語言的非英文資料以提高模型在英文以外語言上的效能。Meta 還表示使用了合成資料以增加適應性。
毒性和偏見問題
Meta 聲稱 Llama 3 透過新的資料過濾管線和更新的生成式人工智慧安全套件來改善對毒性和偏見的控制。不過這些過濾工具並不是百分之百可靠。
展望
Meta 在未來將推出效能更強大的模型,並計劃使 Llama 3 成為多語言和多模態,能夠處理更多資料並理解影象等其他模式。
來源:TechCrunch
延伸閱讀
- Microsoft 推出針對團隊的 CoPilot
- ChatGPT 推出 GPT-4o 後,移動應用程式收入獲得史上最大提升
- Google I/O 2024:Google 剛宣布的所有重大訊息
- Restaurant365 以 10 億美元以上的估值籌得 1.75 億美元,擬擴大其餐飲業軟體堆砌
- Google 將實現千禧星座技術於 Google 地圖平臺
- 特斯拉盈利的超級充電站網路被馬斯克解散整個團隊
- 開放 AI (OpenAI)的 ChatGPT 新聞發布:我們當前所知道的事情
- OpenAI 考慮允許 AI 色情內容?
- OpenAI 揭開 AI 祕密指令的面紗
- AI 助您創辦者更快、更輕鬆地籌集資金嗎?