市場觀察

開拓 AI 獲得 500 萬美元,利用語言模型建立適合訓練的資料集

使用語言模型的公司「Refuel AI」宣布獲得 520 萬美元種子資金,並即將商業化解決 AI 開發的資料挑戰隨著人工智慧(AI)技術的發展,許多企業都開始尋求成為 AI 公司,並與內部專家和第三方供應商合作,開發針對不同業務用例的模型。然而 AI 專案最重要的起點是乾淨且標註完整的資料。只有透過 .... (往下繼續閱讀)

分享到 Facebook 分享到 Line 分享到 Twitter

文章目錄

開拓 AI 獲得 500 萬美元,利用語言模型建立適合訓練的資料集

使用語言模型的公司「Refuel AI」宣布獲得 520 萬美元種子資金,並即將商業化

解決 AI 開發的資料挑戰

隨著人工智慧(AI)技術的發展,許多企業都開始尋求成為 AI 公司,並與內部專家和第三方供應商合作,開發針對不同業務用例的模型。然而 AI 專案最重要的起點是乾淨且標註完整的資料。只有透過正確的資料標註,專案才能順利進行。然而儘管公司擁有大量資料,但並非所有資料都能直接用於訓練模型。資料需要經過清理和標註,這通常需要人工團隊耗時數週甚至數月進行。這種方式無法滿足當今 AI 的需求。

Refuel AI 的創始人 Nihit Desai 和 Rishabh Bhargava 表示他們注意到許多團隊都有針對不同模型和產品的優秀想法,只是缺乏用於訓練的資料。這讓他們開始思考如何實現以思考之速提供乾淨標註資料的目標。

使用語言模型自動標註資料

因此在 2021 年,他們創辦了 RefuelAI,並開發了一個專用平臺,利用專門的語言模型(LLMs)自動建立和標註資料集。該平臺可以為各種業務和用例生成質量優於或優於人工標註的資料集。

根據該公司的說法,企業使用者僅需上傳資料集,然後指示語言模型進行標註即可使用這一平臺。使用者也可以提供指導方針和示例,以確保生成的資料集質量高,適合用於訓練模型。公司執行長補充說:“使用者只需一小時的時間,就能夠獲得足夠的資料開始訓練他們的 AI 模型,然後將其無縫連結到模型訓練基礎設施中。當團隊收集更多資料(尤其是從生產環境中),他們可以將其重新引導到 RefuelAI 進行標註、效能測量,並改進模型重新訓練的資料集。”

在受邀企業的私包測試中,Refuel AI 的解決方案已被證實可以將資料建立和標註的過程加速 100%。然而 Bhargava 沒有透露參與測試的企業名稱,但表示 Refuel AI 在社交媒體、金融科技、醫療保健、人力資源和電子商務等多個行業中受到了廣泛關注。

未來的發展

透過此次由 General Catalyst 和 XYZ Ventures 共同領投的融資,Refuel 計劃將工程團隊的規模從六名增加至十二名,並進一步投資於平臺和語言模型的基礎架構,以在 7 月底實現商業化。公司還將投資於開源庫和社區。Bhargava 表示:“作為一個具體的示例,我們正在組織一場比賽,以推動語言模型驅動的資料標註的技術突破,並提供高達 1 萬美元的獎金。”

當前 Refuel AI 在資料標註領域競爭對手包括 Tasq AI、Snorkel AI 和 SuperAnnotate 等公司。

Refuel AI 的目標是為 AI 專案提供更高效、更具可擴充套件性的資料建立和標註解決方案。透過利用專用的語言模型,該公司希望幫助企業加速將 AI 技術嵌入產品和業務功能,實現商業成功。

Unsplash gallery keyword: Artificial Intelligence-AI 開拓,語言模型,資料集,訓練
程宇肖

程宇肖

Reporter

大家好!我是程宇肖,我對於科技的發展和應用有著濃厚的興趣,並致力於將最新的科技趨勢和創新帶給大家。科技領域的變化速度驚人,每天都有令人興奮的新發現和突破。作為一名部落格作者,我將帶領大家深入探索科技的奧秘和應用的無限可能。