AIGC

從大資料到大 AI:LLM 整合將 Cloudera 資料湖帶入新境界

Cloudera 宣布推出 LLMs 戰略與工具,以整合大 AICloudera 是一家大資料企業,憑藉大資料時代開始商業化。如今 Cloudera 已快速進入大 AI 時代,並推出了幫助企業整合 LLMs 和生成式 AI 的策略和工具,以驅動其 Cloudera Data Platform (CD .... (往下繼續閱讀)

分享到 Facebook 分享到 Line 分享到 Twitter

文章目錄

從大資料到大 AI:LLM 整合將 Cloudera 資料湖帶入新境界

Cloudera 宣布推出 LLMs 戰略與工具,以整合大 AI

Cloudera 是一家大資料企業,憑藉大資料時代開始商業化。如今 Cloudera 已快速進入大 AI 時代,並推出了幫助企業整合 LLMs 和生成式 AI 的策略和工具,以驅動其 Cloudera Data Platform (CDP)。此外 Cloudera 還宣布了其可觀察性平臺的一般可用性,幫助組織監控在 CDP 上執行的資料工作負載。

Cloudera 如何為其資料湖引入 LLMs

Cloudera 沒有打算自己開發 LLMs,而是讓企業更容易地使用擁有資料湖儲存的資料,以獲得對資料的深度洞見。Cloudera 的平臺提供了一個開放的資料湖模型,可讓組織在資料湖儲存上執行資料分析操作。透過 LLMs 的整合Cloudera 正在使企業能夠直接與 Hugging Face 的開源 LLMs 以及開源向量資料庫進行整合,以構建 AI 應用程式。透過使用這種機器學習技術,企業可以快速從現有的資料源中受益。

LLMs 是從大資料到大 AI 的合理發展道路

Cloudera 於 2008 年創立的時候,以開源專案 Hadoop 為基礎的大資料技術,是該公司的基礎。多年來,大資料市場轉向資料湖模型空間,組織用基於 SQL 的查詢引擎進行資料分析,以分析雲端物件儲存庫中儲存的資料。Cloudera 的 CTO Venkatesh 看到 LLMs 作為從大資料的合理發展道路上,邏輯上的下一步。他說:“使用 LLMs 可以使組織在資料分析的極限上獲得更多的資料量,並且使用英語或自然語言查詢代替 SQL 或 Spark 查詢,每次只需將資料注入一次,就可以多次從嵌入輸出中獲取資料,從而提高資料挖掘效率。”

大資料與大 AI 發展所需要的開源資料技術

資料湖技術依賴於資料物件儲存,經常是組織儲存非結構化和半結構化資料的最佳方法。為了使用人工智慧技術,需要使用向量資料庫組織資料。 Cloudera 正在為其 LLM 倉儲框架引入開源向量資料庫,使企業選擇哪個開源向量資料庫更加自由。儘管建立向量資料庫,但並不意味著企業正在複制雙倍資料,而是提供了資料的向量化嵌入功能的索引。

總結

綜上所述,Cloudera 的平臺可幫助企業更輕鬆地整合 LLMs 並將其應用到資料湖程式中。透過使用向量資料庫組織資料,企業可以更輕鬆地建立查詢 AI 模型。總之開源技術在 AI 企業的基礎建設中起著至關重要的作用,並透過這種技術的應用,我們可以期待 AI 企業的發展和提高效率。

Data Science-Cloudera,大資料,大 AI,整合,LLM,資料湖.
程宇肖

程宇肖

Reporter

大家好!我是程宇肖,我對於科技的發展和應用有著濃厚的興趣,並致力於將最新的科技趨勢和創新帶給大家。科技領域的變化速度驚人,每天都有令人興奮的新發現和突破。作為一名部落格作者,我將帶領大家深入探索科技的奧秘和應用的無限可能。