
合成資料在有效聯動知識學習中的應用
編者的筆記
本文經過 Science X 的編輯流程和政策審查,編輯們在確保內容可信度的同時突出以下特點:事實核查和校對。北京中科期刊發布有限公司提出了一個名為 MOTX 的大規模合成資料引擎,研究團隊在機器智慧研究領域發表的論文中探討了三維合成資料是否能取代現實世界的影片進行聯動訓練。研究人員透過手動設定相機和物體的運動特徵,使其與現實世界資料集的特徵相似,並展示了合成資料獲得的聯動知識在現實世界測試集上能夠實現非常類似的效能,而無需域適應技術。
聯動學習的意義
多目標追蹤(MOT)是由多個功能元件組成的系統,例如檢測、視覺表示和聯動。聯動在 MOT 流程的最後一個階段,通常被認為是核心問題,它旨在將邊界框與現有軌道存取起來。聯動模組根據外觀特徵、運動特徵或二者之一進行推斷。在學術界,很多聯動解決方案的共同之處是它們都是用現實世界的影片資料進行訓練的。然而這種做法存在幾個潛在問題。首先在影片幀中標註軌跡需要昂貴的勞動成本,這可能約束了 MOT 訓練資料的規模。其次隱私和道德問題約束了在以人為中心的任務中使用現實世界資料,例如多人行人跟蹤。為了避免這些擔憂,澳大利亞國立大學和清華大學的研究人員調查了如何在 MOT 中使用合成資料。他們建立了一個名為 MOTX 的三維模擬引擎,用於生成具有多個目標、豐富標註和可控視覺因素的影片。這些資料提供了一種廉價的方式來獲得具有準確標籤的大規模資料。透過 MOTX,他們旨在回答兩個有趣的問題。
合成資料對聯動知識學習的影響
首先研究人員使用 MOTX 合成資料,透過手動設定關鍵引數(如攝像機視角),使其接近現實世界的訓練資料集。然後,在合成影片上訓練最近的聯動網路時,與使用現實資料訓練相比,通常可以實現類似甚至更好的跟蹤精度。他們對外觀和運動特徵的消融研究提供了兩個建議。第一,合成資料與現實資料之間的外觀差異很難損害聯動知識的學習。第二,三維引擎可以很好地模擬聯動場景中的運動線索。這些發現可以解釋合成資料的競爭力,並暗示 MOT 比“以外觀為中心”的任務更能從使用合成資料中受益。
運動因素對聯動知識學習的影響
現有資料集主要來自現實世界,如 MOT15 等。儘管這些資料有助於模型訓練,但它們的固定性約束了我們理解系統對不同視覺因素變化的反應機制的機會。研究人員利用 MOTX 的強大定制能力來幫助回答這個問題。他們對物體相關因素和攝像機相關因素對聯動知識學習的影響進行了實證研究。具體而言,他們研究了兩組因素。第一組因素是與行人有關的因素,例如密度和移動速度;第二組是與攝像機有關的因素,包括攝像機視角和攝像機運動狀態。研究人員透過 MOTX 引擎將運動因素抽象為系統引數,因此只需改變這些引數,例如將物體速度設定為 1m/s,就可以輕鬆模擬不同的場景。他們的結果闡明了訓練資料和測試資料之間的因素與 MOT 系統效能之間的關係。
結論
在這份早期的研究中,研究人員對合成資料在 MOT 中的作用進行了思考。他們利用 MOTX 引擎建立了一個大規模的合成資料集,證實了從合成資料中學到的聯動知識可以在現實世界的測試集上取得非常相似的效能,無需進行域適應技術。這項研究爲使用合成資料在 MOT 中提供了新的思路,並爲未來相關研究提供了基礎。
原文連結:https://techxplore.com/news/2023-07-synthetic-effective-association-knowledge.html
延伸閱讀
- Google Sheets 突破性升級!Gemini 引擎助你快速分析資料與建立精彩視覺效果
- 「Bluesky 推出 BlueSkyHunter:全新增長與分析工具助力社交平臺騰飛!」
- 「Perplexity 的超級盃推文助攻!應用程式下載量激增 50%!」
- 探索 Microsoft Copilot:你必須知道的 AI 技術全解析!
- 「Pendulum 推出 AI 驅動平臺,助企業精準預測供需動態!」
- 蘋果訂閱數突破十億大關,2024 年服務收入接近千億美元!
- 資料分析新創 Athenic AI 目標成為企業的核心神經系統!
- 「Threads 使用者數突破 3.2 億大關,僅 8 個月再增 2000 萬!」
- Instagram 新功能:提升創作者對影片表現的全面洞悉!
- 「微軟 Excel 世界冠軍賽:自拍熱潮與帶感隧道!」