
以效能為核心,Deci 在基礎生成式 AI 模型市場上帶來新的競爭
概述
近年來基礎生成式 AI 模型市場呈現蓬勃發展的態勢,能夠應用於編碼、內容生成等廣泛領域。然而以以色列新創公司 Deci 為代表,該行業競爭日趨激烈。Deci 以提高效能為目標,於近日推出了一對開源基礎模型——DeciDiffusion 1.0(影象到文字生成器)和 DeciLM 6B(文字到文字生成器),並提供了名為 Infery LLM 的軟體開發套件(SDK),讓開發人員可在此基礎模型上進行應用的構建,鑒於此對於商業和研究用途。領域。你可以在 HuggingFace 上試用 DeciDiffusion 1.0 和 DeciLM 6B 的簡化版本。
效能優勢和成本節省
值得注意的是,Deci 公司全力以赴追求生成式 AI 推論中效能和速度的新標準,DeviDiffusion 1.0 的速度比競爭對手的 Stable Diffusion 1.5 快三倍,而 DeciLM 6B 的速度比 Meta 的 LLaMA 2 7B 快 15 倍。公司新聞稿寫道:“透過使用 Deci 的開源生成模型和 Infery LLM,AI 團隊可以將它們的推論計算成本降低 80%,並使用廣泛可用的成本友好的 GPU,如 NVIDIA A10,同時提高其產品的質量。”鑒於矽谷正討論著訓練和部署 AI 模型和推論所需的適當圖形處理單元(主要來自市場領導者 Nvidia)的明顯不足,Deci 的提供更具能力和成本效益的模型及配套開發套件,正好抓住了這個時機。
AutoNAC 技術:攻擊競爭對手,重新構建模型
Deci 稱其能夠實現這些令人驚嘆的效果,是透過其獨特專利的神經架構搜尋(AutoNAC)技術來實現的。該技術基本上分析現有的 AI 模型,並構建一個全新的由小型模型組成的 AI,其“整體功能與”原始模型相當接近“,根據 Deci 技術白皮書中的描述。白皮書提到:“AutoNAC 管道接收使用者訓練的深度神經網路、資料集和推理平臺的存取,然後重新設計使用者的神經網路,以獲得一個最佳化的體系結構,其延遲通常是原始模型的 2 到 10 倍,而且不會影響準確性。”換句話說,Deci 的技術可以對當前您的企業或組織部署的任何模型進行重新設計,使其執行速度更快、更高效,從而大大降低了原始、較大模型的雲伺服器成本。就 DeciDiffusion 和 DeciLM 6B 而言,這些模型是透過對 Stable Diffusion 1.5 和 Meta 的 LLaMA 2 7B 進行訓練和開發而來。換言之,Deci 利用了這兩個開源模型,並將其應用於自家的訓練體系結構,創造出了新的、更快、更有效的模型。由於 Deci 的模型也是開源的,因此可以免費使用,即使是商業用途。那麼,該公司計劃如何獲利呢?當然是透過對 SDK 收取費用。“Infery-LLM SDK 需要訂閱,” Deci 的發言人在電子郵件中向 VentureBeat 寫道。“團隊可以使用我們的開源模型自由選擇任何工具,而且相比於其他模型,能夠獲得更佳的效能。但是為了最大程度地發揮速度和效率,他們可以獲得 Infery-LLM SDK 的存取許可權,以最佳化並在任何環境中執行模型。”
模型規格
DeciDiffusion 1.0 包含 820 個引數,根據 Deci 在模型上的部落格文章所述。它“經過從 LAION 資料集的 3.2 億樣本子集開始訓練”,並且“在 LAION-ART 資料集的 200 萬樣本子集上進行了微調”,並且在比 Stable Diffusion 1.5 少 40%迭代次數的情況下實現了相當水平的品質。至於 DeciLM 6B 模型,它包括以下內容:· 57 億個引數·32 層· 32 個頭· 4096 個 tokens 序列長度· 4096 個隱藏 token 大小· 可變群組查詢注意(GQA)機制它是使用 Deci 的 AutoNAC 方法在 SlimPijamas 資料集上進行訓練,然後在 OpenOrca 資料集的一個子集上進行“微調”,從而建立出一個速度更快、更小、更高效的模型,名為 DeciLM 6B-Instruct,用於遵從簡短提示。DeciLM 6B 和 DeciLM 6B-Instruct 現在都可以從 Deci 獲得。根據 HuggingFace 的檔案,DeciLM 6B 和 DeciLM 6B-Instruct 都是“用於商業和研究用途的英語模型,並且可以進一步進行其他語言的微調。”VentureBeat 在 DeciDiffusion 1.0 展示測試中取得了一些對比結果:該模型和 Stable Diffusion 1.5 在首次測試中對於包含多個元素的複雜提示都表現出困難。圖:VentureBeat/HuggingFace 透過 HuggingFace 展示測試 DeciDiffusion 1.0 的能力。 信用:VentureBeat/HuggingFace 與此相比,VentureBeat 在 HuggingFace 上對 DeciLM 6B-Instruct 模型進行的簡要測試取得了更令人印象深刻的結果,它提供了歷史的大致摘要和可讀的求職信,如下圖所示。圖:VentureBeat/HuggingFace 透過 HuggingFace 展示測試 DeciLM 6B-Instruct 的能力。 信用:VentureBeat/HuggingFace 顯然,Deci 希望為那些考慮為企業選擇開源 LLM 和基礎模型的人提供引人入勝的解決方案,同時也為研究界提供相應支援,以此來提升並更進一步推進現有開源 AI 模型的發展。無論發生什麼事情,當前的開源 AI 市場和生成式 AI 市場的競爭環境顯然令人興奮。VentureBeat 的使命是成為技術決策者獲取有關變革性企業技術並進行交易的數位場所。探索我們的簡報。
結語
Deci 作為以色列新創公司,旨在透過提高效能,成為生成式 AI 模型市場中的重要參與者。其開源模型 DeciDiffusion 1.0 和 DeciLM 6B 以及 Infery LLM SDK 的推出,為企業和研究機構開發基於模型的應用提供了便利。Deci 公司透過獨特的 AutoNAC 技術,重新設計並最佳化現有的 AI 模型,以實現更快、更高效的推論運算,從而降低雲伺服器成本。由於 Deci 的模型是開源的,所以可以免費使用,並且可以自由調整為商業和研究用途。然而 Deci 公司透過 SDK 收費來獲得獲利。Deci 的效能和成本優勢對於那些正在尋求開源 LLM 和基礎模型的企業和研究機構來說無疑是一個有吸引力的選擇。當前開源 AI 和生成式 AI 市場的競爭狀況令人興奮,無論是對於 Deci 還是整個行業來說都面臨著充滿挑戰和機遇的時刻。
延伸閱讀
- 「Inception 首度曝光!全新 AI 模型顛覆科技界!」
- 《Anthropic 利用寶可夢測試最新 AI 模型,成果驚人!》
- Google 悄然推出下一代旗艦 AI 模型,科技界即將震撼!
- AI2 推出新 AI 模型,成功超越 DeepSeek 最佳技術!
- xAI 新一代 AI 模型遲遲未發,背後隱藏的趨勢曝光!
- Google 執行長宣布:AI 模型 Gemini 將成為 2025 年最大焦點!
- 「DeepSeek 最新 AI 模型為何自認是 ChatGPT?揭祕背後的技術奧妙!」
- DeepSeek 推出新 AI 模型,成為最佳「開放挑戰者」!
- Pictionary 與 Minecraft:測試 AI 模型創意潛力的新戰場!
- AI 模型在西班牙語選舉問題上表現不佳,研究揭示了隱藏的語言障礙!