資料科技公司 Databricks 推出 Delta Lake 3.0,加固對開放格式的支援
概述
資料科技公司 Databricks 在其年度會議中宣布推出 Delta Lake 3.0 版本,該版本增加了對 Apache Iceberg 和 Apache Hudi 開放表格格式的自動支援。這一舉措將使企業使用者能夠擺脫繁瑣的整合工作,專注於打造真正開放的資料湖倉庫。Delta Lake 3.0 還包括 Delta Kernel 和 Liquid Clustering 兩項新功能,旨在提供更簡單、更可靠的資料處理方案。重要特點
1. 支援開放格式:Delta Lake 3.0 版本引入了 Universal Format(UniForm),該功能可自動支援 Iceberg 和 Hudi 表格格式,實現不同格式之間的互通性,使得其他外部資料可以輕鬆儲存到 Delta Lake 中。Databricks 的三種格式支援使其在追求開放性和簡單性的努力中保持領先地位。 2. Delta Kernel:Delta Kernel 的目的是解決每次新版本或協議更改時必須重寫 Delta 存取器的問題。透過提供一個穩定的 API,該功能將確儲存取器建立在實現最新規格的核心 Delta 庫上。 3. Liquid Clustering:Liquid Clustering 引入了靈活的資料佈局技術,可隨著資料的增長提供成本效益的資料聚簇,幫助企業滿足讀寫效能需求。對行業的影響
這一新版本的釋出將對企業資料儲存和分析過程產生重大影響。 首先 Delta Lake 3.0 的 Universal Format 功能提供了跨不同格式之間的無縫資料操作,使得企業能夠更靈活地處理和分析資料,而不再受限於單一格式的選擇。這將降低資料整合的成本和風險,提高企業的資料治理能力。 其次 Delta Kernel 的推出將減少開發和維護 Delta 存取器的困擾。透過提供穩定的 API,企業可以更容易地構建與 Delta 庫最新規格相適應的存取器,從而加快資料儲存和處理的速度。 最後 Liquid Clustering 的引入將幫助企業在資料集增長的同時實現成本效益的資料佈局。這將幫助企業應對越來越大的資料量,同時保證高效的讀寫效能。產業觀點
根據 Databricks 提供的統計資料,Delta Lake 每年有超過 10 億次的下載,並得到 AWS、Adobe、eBay、Twilio 和 Uber 等企業的支援和貢獻。這顯示了 Delta Lake 在資料湖倉庫領域的廣泛應用和受到業界信賴。評論和建議
Databricks 的 Delta Lake 3.0 版本的推出,彰顯了資料科技公司對開放性和簡單性的追求。透過支援多種開放格式,Delta Lake 使企業能夠更靈活地處理和分析資料,從而加快創新和決策的速度。 然而這一技術的應用還需要企業在組織、文化和技術等多個層面上進行相應的調整和轉型。首先企業需要培養資料驅動的文化,推動資料作為決策和創新的基礎。其次企業需要建立完善的資料治理機制,確保資料的品質、準確性和安全性。最後企業需要結合具體業務場景,制定相應的資料分析策略和工具,以實現具體的業務價值。 在推動資料湖倉庫的過程中,企業應該選擇一個可靠的技術合作夥伴,如 Databricks,以確保技術的可靠性和可擴充套件性。同時企業應該密切關注行業的最新動態和技術趨勢,及時調整和最佳化自身的資料戰略,以保持競爭優勢。建議
1. 培養資料驅動的文化和組織氛圍,將資料作為決策和創新的基礎。 2. 建立完善的資料治理機制,確保資料的品質、準確性和安全性。 3. 結合具體業務場景,制定相應的資料分析策略和工具,以實現具體的業務價值。 4. 選擇可靠的技術合作夥伴,確保技術的可靠性和可擴充套件性。 5. 密切關注行業的最新動態和技術趨勢,及時調整和最佳化資料戰略。Databricks-Databricks,DeltaLake,開放資料湖倉庫
延伸閱讀
- 資料科技巨頭 Databricks 以 1 億美元收購企業資料複製器 Arcion
- 從 430 億美元估值開始,Databricks 以 1 億美元收購資料複製新創公司 Arcion
- Databricks 即將上市,我們可能在上市前退休
- 我們可能在 Databricks 上市前退休
- 隨著 Databricks 的資本注入,AI 市場競爭白熱化
- 敵對供應商 Snowflake 最大客戶支援,Databricks 成功獲得 5 億美元融資
- Databricks 募得 5 億美元額外資金,估值躍升至 430 億美元,儘管處於晚期困境,增長無懼!
- Salesforce 攜手 Databricks 和 Snowflake 打造更強大的企業資料基礎設施
- Databricks 大手筆投資 Hightouch,為銷售人員啟用資料打下賭注
- 資料湖聯盟!Databricks 打造資料網格