AIGC

進軍自動化資料整理!Cleanlab 獲得 500 萬美元資金為 LLMs 和現代 AI 堆疊提供支援

「Cleanlab」獲得 500 萬美元種子融資:解決機器學習領域的「骯髒資料問題」引言資料品質一直是阻礙機器學習模型發展的重要問題之一。最近,一家名為「Cleanlab」的新創公司宣布獲得 500 萬美元的種子融資,將用於解決企業人工智慧領域中的「骯髒資料問題」。這次投資由貝恩資本領投,表明了投資 .... (往下繼續閱讀)

分享到 Facebook 分享到 Line 分享到 Twitter

文章目錄

進軍自動化資料整理!Cleanlab 獲得 500 萬美元資金為 LLMs 和現代 AI 堆疊提供支援

Cleanlab」獲得 500 萬美元種子融資:解決機器學習領域的「骯髒資料問題」

引言

資料品質一直是阻礙機器學習模型發展的重要問題之一。最近,一家名為「Cleanlab」的新創公司宣布獲得 500 萬美元的種子融資,將用於解決企業人工智慧領域中的「骯髒資料問題」。這次投資由貝恩資本領投,表明了投資者對 Cleanlab 使命的高度信心。Cleanlab 的創始人包括 Curtis Northcutt、Jonas Mueller 和 Anish Athalye,他們開發了一種開源產品,能夠識別、理解並清理資料中的錯誤標籤,以此顯著提高機器學習模型的效果。

骯髒資料問題

Cleanlab 創始人之一的 Curtis Northcutt 在最近接受 VentureBeat 的採訪時表示資料整理通常是一個耗時且繁瑣的過程,需要大量的時間和資源。他補充說,Cleanlab 希望能夠透過他在麻省理工學院的博士研究期間建立的一種方法,即「可信學習」,自動化並簡化這個過程。 可信學習是一種方法,它估計出真實標籤和錯誤標籤之間的聯合分佈,並利用此訊息找出資料集中最有可能的錯誤。 它還可以估計每個標籤和每個示例的準確度,並為每個標籤提供信心分數。

Cleanlab 的產品和使用者

Cleanlab 提供兩款產品:Cleanlab 開源和 Cleanlab Studio。 Cleanlab 開源是一個免費的、開源的 Python 庫,任何人都可以使用它來對資料集應用可信學習。Cleanlab Studio 是一個基於雲的 SaaS 產品,提供使用者友好的介面和高級功能,用於資料整理。 Cleanlab Studio 還與流行的 LLM 框架和平臺(如 Hugging Face Transformers、Google Cloud AI Platform、Amazon SageMaker、Microsoft Azure Machine Learning 和 IBM Watson)整合。 Cleanlab 已吸引了超過 10,000 名使用者對其開源專案的使用,並擁有超過 100 個 Cloud Studio 的客戶,客戶包括財富 500 強公司、政府機構、研究機構以及來自電子商務、醫療保健、社交媒體、教育、娛樂和金融等各個領域和行業的新創企業。 Northcutt 表示 Cleanlab 計劃利用種子融資擴大團隊,擴大產品開發和客戶基礎。

投資者對資料中心 AI 解決方案的信心上升

貝恩資本的 Aaref Hilaly 和 Rak Garg 表示他們對 Cleanlab 的團隊、技術和願景印象深刻。他們認為 Cleanlab 正在解決企業人工智慧領域中一個巨大而未開發的問題。Garg 補充道,Cleanlab 是貝恩資本在人工智慧領域的多家投資之一。

為企業 LLM 塑造未來

Cleanlab 是眾多新興新創企業中的一員,它們正在開發出符合企業人工智慧解決方案需求的產品,特別是 LLM。根據 Gartner 最近的一份報告,到 2024 年,69%的管理工作將被完全自動化,這很可能涉及使用 LLM 進行排程、報告和決策等任務。影響 LLM 在企業中採用和部署的最大障礙之一是資料品質和資料整理。Cleanlab 的資料整理解決方案可以幫助企業克服這些挑戰,發揮 LLM 在各種用例和應用中的全部潛力。透過使用 Cleanlab,企業可以提高資料集和模型的質量和可靠性,降低資料整理的時間和成本,確保對 LLM 的道德和負責任的使用。Cleanlab 還可以幫助企業在競爭中佔據優勢,從其資料資產中創造價值。

結論

Cleanlab 是一家致力於解決機器學習領域「骯髒資料問題」的新創公司,獲得了 500 萬美元的種子融資。透過開發開源產品和基於雲的 SaaS 產品,Cleanlab 為使用者提供理解決資料整理問題的工具和平臺。這次投資是投資者對其使命和技術的高度肯定,也體現了投資者對資料中心 AI 解決方案的信心上升。未來,Cleanlab 將致力於擴大團隊、擴大產品開發和增加客戶基礎,以推動企業人工智慧領域的發展和創新。

(本文為虛構文章,與現實情況無關)

Automation-自動化資料整理,Cleanlab,資金,LLMs,現代 AI 堆疊,支援

程宇肖

程宇肖

Reporter

大家好!我是程宇肖,我對於科技的發展和應用有著濃厚的興趣,並致力於將最新的科技趨勢和創新帶給大家。科技領域的變化速度驚人,每天都有令人興奮的新發現和突破。作為一名部落格作者,我將帶領大家深入探索科技的奧秘和應用的無限可能。