市場觀察

Comet 與 Snowflake 合作,提升機器學習資料集的可重複性

Comet 與 Snowflake 的策略合作:加速機器學習模型開發與追蹤美國 ML 平臺 Comet 近日宣布與資料分析公司 Snowflake 達成戰略合作,致力於推出創新解決方案,讓資料科學家能夠更快速地建立優秀的機器學習(ML)模型,提升資料驅動的決策能力。這次合作將把 Comet 的解決方 .... (往下繼續閱讀)

分享到 Facebook 分享到 Line 分享到 Twitter

文章目錄

Comet 與 Snowflake 合作,提升機器學習資料集的可重複性

CometSnowflake 的策略合作:加速機器學習模型開發與追蹤

美國 ML 平臺 Comet 近日宣布與資料分析公司 Snowflake 達成戰略合作,致力於推出創新解決方案,讓資料科學家能夠更快速地建立優秀的機器學習(ML)模型,提升資料驅動的決策能力。這次合作將把 Comet 的解決方案整合到 Snowflake 的統一平臺中,讓開發人員能夠在 Snowflake 的環境中追蹤和版本控制他們的 Snowflake 查詢和資料集。Comet 預計,這種整合將有助於追蹤模型的起源和效能,提供對開發過程和資料變化對模型效能影響的改進可視性和理解能力。透過利用 Snowflake 資料,客戶現在可以從流程更加簡化和透明的模型開發中受益。Snowflake 的資料雲和 Comet 的 ML 平臺結合,將使全球客戶能夠更快速地建立、訓練、部署和監控模型。

模型開發與資料管理之間的反饋環

Comet 的執行長 Gideon Mendels 告訴 VentureBeat:“此外這個合作還建立了 Comet 模型開發與 Snowflake 資料管理之間的反饋環。”這個反饋環可以不斷改進模型,將實驗與部署之間的差距縮小,實現機器學習的關鍵承諾-隨著時間的推移進行學習和適應。在 Snowflake 中,版本可追蹤的資料和模型可以讓組織定義針對資料變化及其對模型在生產中的影響所需的行動步驟。Comet 最新的解決方案跟隨其最近發布的一套工具和整合,旨在加快資料科學家在大型語言模型(LLMs)中的工作流程。

將模型效能變化與資料變化聯絡起來

在機器學習中,訓練資料的重要性與模型本身相等。資料的變化,比如引入新的特徵、處理缺失值或調整資料分佈,都可能深刻影響模型的效能。該公司表示透過追蹤模型的源起,可以建立模型效能變化與資料變化之間的聯絡。這不僅有助於偵錯和理解效能問題,還指導資料質量和特徵工程。Mendels 說,隨著時間的推移追蹤查詢和資料可以產生一個反饋環,推動資料管理和模型開發階段的持續改進。“模型源起可以促進資料科學家團隊之間的合作,因為它允許任何人理解模型的歷史和開發過程,而無需進行大量檔案記錄,”Mendels 說。“當團隊成員離職或新成員加入團隊時,這尤其有用,可以實現無縫的知識傳遞。”

Comet 的未來展望

Comet 的 CEO 稱,使用 Comet 的客戶,如 Uber、Etsy 和 Shopify 等,通常報告稱其 ML 速度提高了 70%至 80%。“這歸因於更快速的研究週期,理解模型效能並更快地檢測問題,更好的協作等等。”Mendels 說。“透過這個聯合解決方案,這個速度應該會進一步提高,因為現在在兩個系統之間仍然存在著一些挑戰。客戶可以透過將資料保留在 Snowflake 中而節省傳輸和消耗成本。”Mendels 表示 Comet 的目標是成為事實上的人工智慧開發平臺。“我們的觀點是,企業只有在根據自己的資料部署這些模型之後,才能真正從人工智慧中獲得價值。”他說。“不管他們是從頭開始訓練,還是微調一個開源模型,或者使用上下文注入聊天 GPT,Comet 的使命都是使這個過程無縫,縮小研究和生產之間的差距。”





原文資料來源:VentureBeat
Unsplash gallery keyword: Collaboration-Comet,Snowflake,machinelearning,dataset,reproducibility
程宇肖

程宇肖

Reporter

大家好!我是程宇肖,我對於科技的發展和應用有著濃厚的興趣,並致力於將最新的科技趨勢和創新帶給大家。科技領域的變化速度驚人,每天都有令人興奮的新發現和突破。作為一名部落格作者,我將帶領大家深入探索科技的奧秘和應用的無限可能。