使用語言模型的公司「Refuel AI」宣布獲得 520 萬美元種子資金,並即將商業化
解決 AI 開發的資料挑戰
隨著人工智慧(AI)技術的發展,許多企業都開始尋求成為 AI 公司,並與內部專家和第三方供應商合作,開發針對不同業務用例的模型。然而 AI 專案最重要的起點是乾淨且標註完整的資料。只有透過正確的資料標註,專案才能順利進行。然而儘管公司擁有大量資料,但並非所有資料都能直接用於訓練模型。資料需要經過清理和標註,這通常需要人工團隊耗時數週甚至數月進行。這種方式無法滿足當今 AI 的需求。
Refuel AI 的創始人 Nihit Desai 和 Rishabh Bhargava 表示他們注意到許多團隊都有針對不同模型和產品的優秀想法,只是缺乏用於訓練的資料。這讓他們開始思考如何實現以思考之速提供乾淨標註資料的目標。
使用語言模型自動標註資料
因此在 2021 年,他們創辦了 RefuelAI,並開發了一個專用平臺,利用專門的語言模型(LLMs)自動建立和標註資料集。該平臺可以為各種業務和用例生成質量優於或優於人工標註的資料集。
根據該公司的說法,企業使用者僅需上傳資料集,然後指示語言模型進行標註即可使用這一平臺。使用者也可以提供指導方針和示例,以確保生成的資料集質量高,適合用於訓練模型。公司執行長補充說:“使用者只需一小時的時間,就能夠獲得足夠的資料開始訓練他們的 AI 模型,然後將其無縫連結到模型訓練基礎設施中。當團隊收集更多資料(尤其是從生產環境中),他們可以將其重新引導到 RefuelAI 進行標註、效能測量,並改進模型重新訓練的資料集。”
在受邀企業的私包測試中,Refuel AI 的解決方案已被證實可以將資料建立和標註的過程加速 100%。然而 Bhargava 沒有透露參與測試的企業名稱,但表示 Refuel AI 在社交媒體、金融科技、醫療保健、人力資源和電子商務等多個行業中受到了廣泛關注。
未來的發展
透過此次由 General Catalyst 和 XYZ Ventures 共同領投的融資,Refuel 計劃將工程團隊的規模從六名增加至十二名,並進一步投資於平臺和語言模型的基礎架構,以在 7 月底實現商業化。公司還將投資於開源庫和社區。Bhargava 表示:“作為一個具體的示例,我們正在組織一場比賽,以推動語言模型驅動的資料標註的技術突破,並提供高達 1 萬美元的獎金。”
當前 Refuel AI 在資料標註領域競爭對手包括 Tasq AI、Snorkel AI 和 SuperAnnotate 等公司。
Refuel AI 的目標是為 AI 專案提供更高效、更具可擴充套件性的資料建立和標註解決方案。透過利用專用的語言模型,該公司希望幫助企業加速將 AI 技術嵌入產品和業務功能,實現商業成功。
延伸閱讀
- 奧沃馬基金會釋出開放地圖資料集首個測試版
- 瓦納計劃讓使用者出租 Reddit 資料以訓練人工智慧【AI】
- Modal 籌集 2500 萬美元,為企業員工提供資料與人工智慧訓練
- Kin.art 推出免費工具,防止 GenAI 模型在藝術品上進行訓練
- 研究發現:人類學家發現 AI 模型可以被訓練成欺騙者
- Google 公佈利用影片和大型語言模型訓練機器人的新方法
- Giga ML 推出離線部署低資源語言模型幫助企業
- 亞馬遜 SageMaker HyperPod 讓 LLM 模型的訓練和微調更輕鬆
- Together 獲得 1.025 億美元投資,助力其發展用於訓練生成式人工智慧的雲端技術
- 亞馬遜推出新晶片,用於訓練和執行 AI 模型