
Cloudera 宣布推出 LLMs 戰略與工具,以整合大 AI
Cloudera 是一家大資料企業,憑藉大資料時代開始商業化。如今 Cloudera 已快速進入大 AI 時代,並推出了幫助企業整合 LLMs 和生成式 AI 的策略和工具,以驅動其 Cloudera Data Platform (CDP)。此外 Cloudera 還宣布了其可觀察性平臺的一般可用性,幫助組織監控在 CDP 上執行的資料工作負載。
Cloudera 如何為其資料湖引入 LLMs
Cloudera 沒有打算自己開發 LLMs,而是讓企業更容易地使用擁有資料湖儲存的資料,以獲得對資料的深度洞見。Cloudera 的平臺提供了一個開放的資料湖模型,可讓組織在資料湖儲存上執行資料分析操作。透過 LLMs 的整合,Cloudera 正在使企業能夠直接與 Hugging Face 的開源 LLMs 以及開源向量資料庫進行整合,以構建 AI 應用程式。透過使用這種機器學習技術,企業可以快速從現有的資料源中受益。
LLMs 是從大資料到大 AI 的合理發展道路
Cloudera 於 2008 年創立的時候,以開源專案 Hadoop 為基礎的大資料技術,是該公司的基礎。多年來,大資料市場轉向資料湖模型空間,組織用基於 SQL 的查詢引擎進行資料分析,以分析雲端物件儲存庫中儲存的資料。Cloudera 的 CTO Venkatesh 看到 LLMs 作為從大資料的合理發展道路上,邏輯上的下一步。他說:“使用 LLMs 可以使組織在資料分析的極限上獲得更多的資料量,並且使用英語或自然語言查詢代替 SQL 或 Spark 查詢,每次只需將資料注入一次,就可以多次從嵌入輸出中獲取資料,從而提高資料挖掘效率。”
大資料與大 AI 發展所需要的開源資料技術
資料湖技術依賴於資料物件儲存,經常是組織儲存非結構化和半結構化資料的最佳方法。為了使用人工智慧技術,需要使用向量資料庫組織資料。 Cloudera 正在為其 LLM 倉儲框架引入開源向量資料庫,使企業選擇哪個開源向量資料庫更加自由。儘管建立向量資料庫,但並不意味著企業正在複制雙倍資料,而是提供了資料的向量化嵌入功能的索引。
總結
綜上所述,Cloudera 的平臺可幫助企業更輕鬆地整合 LLMs 並將其應用到資料湖程式中。透過使用向量資料庫組織資料,企業可以更輕鬆地建立查詢 AI 模型。總之開源技術在 AI 企業的基礎建設中起著至關重要的作用,並透過這種技術的應用,我們可以期待 AI 企業的發展和提高效率。
延伸閱讀
- OpenAI 計劃將 Sora 影片生成器整合至 ChatGPT,開啟創意新視界!
- 「MoneyHash 獲得 520 萬美元資金,助力中東與北非支付服務整合」
- 「Cohesity 與 Veritas 合併完成!看他們如何整合新戰略」
- X 計劃將更深度整合 Grok 的人工智慧,應用程式研究人員發現
- 亞馬遜整合亞馬遜診所成為 One Medical 品牌
- Illumex 使用 GenAI 輕鬆解決 LLM 資料獲取難題
- 將 LLM 與人類合作,EasyTranslate 認為將超越純人工智慧翻譯服務
- SurrealDB 幫助開發者整合他們的資料庫
- 蘋果提前取消「稍後付款」功能,準備整合 Affirm 付款服務
- Databricks 擴充套件 Mosaic AI 以幫助企業使用 LLM 打造新格局