Meta 釋出 Llama 3,聲稱是最優秀的開源模型之一
作者:Kyle Wiggers,時間:8 小時前
概述
Meta 最近發布了其 Llama 系列開源生成式人工智慧模型的最新成員:Llama 3。更確切地說,該公司已經在其新的 Llama 3 系列中開源了兩個模型,其他模型的釋出日期尚未確保。Meta 將這些新模型描述為與前代 Llama 模型相比在效能上的一個“重大飛躍”。Llama 3 8B 包含 80 億個引數,而 Llama 3 70B 包含 700 億個引數。Meta 表示就其引數數量而言,Llama 3 8B 和 Llama 3 70B 在透過兩個自定義 24,000 GPU 叢集進行訓練後,如今成為當今最效能卓越的生成式人工智慧模型之一。
支援主張
Meta 指出 Llama 3 模型在 MMLU、ARC、DROP 等多個人工智慧基準測試上的成績表現出色。然而這些基準測試的實用性和有效性仍受到爭議。Meta 還表示 Llama 3 8B 在至少九個基準測試上超越了其他開源模型,包括 Mistral 的 Mistral 7B 和 Google 的 Gemma 7B。此外 Meta 還聲稱,引數更多的 Llama 3 70B 與 Google 的 Gemini 系列等旗艦生成式人工智慧模型競爭力強勁。
訓練資料及資源
Meta 表示 Llama 3 模型使用了龐大的訓練資料,包括了來自 “公開可用來源的” 資料,其中包含 30 多種語言的非英文資料以提高模型在英文以外語言上的效能。Meta 還表示使用了合成資料以增加適應性。
毒性和偏見問題
Meta 聲稱 Llama 3 透過新的資料過濾管線和更新的生成式人工智慧安全套件來改善對毒性和偏見的控制。不過這些過濾工具並不是百分之百可靠。
展望
Meta 在未來將推出效能更強大的模型,並計劃使 Llama 3 成為多語言和多模態,能夠處理更多資料並理解影象等其他模式。
來源:TechCrunch