
使用語言模型的公司「Refuel AI」宣布獲得 520 萬美元種子資金,並即將商業化
解決 AI 開發的資料挑戰
隨著人工智慧(AI)技術的發展,許多企業都開始尋求成為 AI 公司,並與內部專家和第三方供應商合作,開發針對不同業務用例的模型。然而 AI 專案最重要的起點是乾淨且標註完整的資料。只有透過正確的資料標註,專案才能順利進行。然而儘管公司擁有大量資料,但並非所有資料都能直接用於訓練模型。資料需要經過清理和標註,這通常需要人工團隊耗時數週甚至數月進行。這種方式無法滿足當今 AI 的需求。
Refuel AI 的創始人 Nihit Desai 和 Rishabh Bhargava 表示他們注意到許多團隊都有針對不同模型和產品的優秀想法,只是缺乏用於訓練的資料。這讓他們開始思考如何實現以思考之速提供乾淨標註資料的目標。
使用語言模型自動標註資料
因此在 2021 年,他們創辦了 RefuelAI,並開發了一個專用平臺,利用專門的語言模型(LLMs)自動建立和標註資料集。該平臺可以為各種業務和用例生成質量優於或優於人工標註的資料集。
根據該公司的說法,企業使用者僅需上傳資料集,然後指示語言模型進行標註即可使用這一平臺。使用者也可以提供指導方針和示例,以確保生成的資料集質量高,適合用於訓練模型。公司執行長補充說:“使用者只需一小時的時間,就能夠獲得足夠的資料開始訓練他們的 AI 模型,然後將其無縫連結到模型訓練基礎設施中。當團隊收集更多資料(尤其是從生產環境中),他們可以將其重新引導到 RefuelAI 進行標註、效能測量,並改進模型重新訓練的資料集。”
在受邀企業的私包測試中,Refuel AI 的解決方案已被證實可以將資料建立和標註的過程加速 100%。然而 Bhargava 沒有透露參與測試的企業名稱,但表示 Refuel AI 在社交媒體、金融科技、醫療保健、人力資源和電子商務等多個行業中受到了廣泛關注。
未來的發展
透過此次由 General Catalyst 和 XYZ Ventures 共同領投的融資,Refuel 計劃將工程團隊的規模從六名增加至十二名,並進一步投資於平臺和語言模型的基礎架構,以在 7 月底實現商業化。公司還將投資於開源庫和社區。Bhargava 表示:“作為一個具體的示例,我們正在組織一場比賽,以推動語言模型驅動的資料標註的技術突破,並提供高達 1 萬美元的獎金。”
當前 Refuel AI 在資料標註領域競爭對手包括 Tasq AI、Snorkel AI 和 SuperAnnotate 等公司。
Refuel AI 的目標是為 AI 專案提供更高效、更具可擴充套件性的資料建立和標註解決方案。透過利用專用的語言模型,該公司希望幫助企業加速將 AI 技術嵌入產品和業務功能,實現商業成功。
延伸閱讀
- OpenAI 重磅推出 GPT-4.5:歷史上最大的語言模型來了!
- 「MLCommons 與 Hugging Face 聯手推出龐大語音資料集,助力 AI 研究新境界!」
- OpenAI AI 推理模型竟然會「用中文思考」,背後原因成謎!
- 馬克·祖克柏批準 Meta Llama 團隊開啟版權作品訓練,引發法律爭議!
- 「Squarespace CPO 保羅·古拜揭示:如何用品味與策展訓練其人工智慧工具!」
- LinkedIn 更新服務條款前是否私自捕獲使用者資料進行訓練?真相大揭密!
- Meta 承認:為 AI 訓練全盤掃描所有公開貼文!
- 扎克伯格:Meta 為訓練 Llama 4 需十倍於 Llama 3 的運算能力!
- Meta 暫停在巴西訓練生成式人工智慧工具
- 開放 AI 與 Reddit 資料簽署合約,訓練人工智慧