
Comet 與 Snowflake 的策略合作:加速機器學習模型開發與追蹤
美國 ML 平臺 Comet 近日宣布與資料分析公司 Snowflake 達成戰略合作,致力於推出創新解決方案,讓資料科學家能夠更快速地建立優秀的機器學習(ML)模型,提升資料驅動的決策能力。這次合作將把 Comet 的解決方案整合到 Snowflake 的統一平臺中,讓開發人員能夠在 Snowflake 的環境中追蹤和版本控制他們的 Snowflake 查詢和資料集。Comet 預計,這種整合將有助於追蹤模型的起源和效能,提供對開發過程和資料變化對模型效能影響的改進可視性和理解能力。透過利用 Snowflake 資料,客戶現在可以從流程更加簡化和透明的模型開發中受益。Snowflake 的資料雲和 Comet 的 ML 平臺結合,將使全球客戶能夠更快速地建立、訓練、部署和監控模型。
模型開發與資料管理之間的反饋環
Comet 的執行長 Gideon Mendels 告訴 VentureBeat:“此外這個合作還建立了 Comet 模型開發與 Snowflake 資料管理之間的反饋環。”這個反饋環可以不斷改進模型,將實驗與部署之間的差距縮小,實現機器學習的關鍵承諾-隨著時間的推移進行學習和適應。在 Snowflake 中,版本可追蹤的資料和模型可以讓組織定義針對資料變化及其對模型在生產中的影響所需的行動步驟。Comet 最新的解決方案跟隨其最近發布的一套工具和整合,旨在加快資料科學家在大型語言模型(LLMs)中的工作流程。
將模型效能變化與資料變化聯絡起來
在機器學習中,訓練資料的重要性與模型本身相等。資料的變化,比如引入新的特徵、處理缺失值或調整資料分佈,都可能深刻影響模型的效能。該公司表示透過追蹤模型的源起,可以建立模型效能變化與資料變化之間的聯絡。這不僅有助於偵錯和理解效能問題,還指導資料質量和特徵工程。Mendels 說,隨著時間的推移追蹤查詢和資料可以產生一個反饋環,推動資料管理和模型開發階段的持續改進。“模型源起可以促進資料科學家團隊之間的合作,因為它允許任何人理解模型的歷史和開發過程,而無需進行大量檔案記錄,”Mendels 說。“當團隊成員離職或新成員加入團隊時,這尤其有用,可以實現無縫的知識傳遞。”
Comet 的未來展望
Comet 的 CEO 稱,使用 Comet 的客戶,如 Uber、Etsy 和 Shopify 等,通常報告稱其 ML 速度提高了 70%至 80%。“這歸因於更快速的研究週期,理解模型效能並更快地檢測問題,更好的協作等等。”Mendels 說。“透過這個聯合解決方案,這個速度應該會進一步提高,因為現在在兩個系統之間仍然存在著一些挑戰。客戶可以透過將資料保留在 Snowflake 中而節省傳輸和消耗成本。”Mendels 表示 Comet 的目標是成為事實上的人工智慧開發平臺。“我們的觀點是,企業只有在根據自己的資料部署這些模型之後,才能真正從人工智慧中獲得價值。”他說。“不管他們是從頭開始訓練,還是微調一個開源模型,或者使用上下文注入聊天 GPT,Comet 的使命都是使這個過程無縫,縮小研究和生產之間的差距。”
原文資料來源:VentureBeat
延伸閱讀
- Perplexity 正式揭曉!全新網頁瀏覽器 Comet 值得期待!
- 加拿大當局抓獲與 Snowflake 資料洩漏事件相關的駭客!
- 3 大新聞重點慘遭資料洩露 !Mandiant 宣稱駭客從 Snowflake 客戶偷走「大量資料」
- 數百個 Snowflake 客戶密碼被發現線上上,與資訊竊取惡意軟體相關
- Snowflake 推出自家旗艦生成式人工智慧模型
- Coalesce 再次籌集資金,以協助 Snowflake 客戶轉換資料
- Snowflake 執行長 Frank Slootman 辭職──華爾街不滿
- Snowflake 全力投入資料清潔房間,並收購 Samooha
- 前 Neeva CEO 表示在 Snowflake 收購後,人工智慧搜尋的擾亂時代即將結束
- 敵對供應商 Snowflake 最大客戶支援,Databricks 成功獲得 5 億美元融資