電腦視覺研究者利用動態捕獲影片中的物件

計算機視覺研究者利用運動在影片中發現物件動態辨識有助於發現物件卡內基梅隆大學的研究人員在計算機視覺領域取得了重要突破，他們表示相較於靜止物件，計算機視覺系統更容易檢測到運動物件，例如街上行駛的汽車或人在人行道上散步。這項研究由該校電腦科學學院院長、機器人學研究所教授 Martial Hebert 和 .... (往下繼續閱讀)

by 江塵
2023/7/28
6 分鐘閱讀時間

A- A A+

文章目錄

計算機視覺研究者利用運動在影片中發現物件

動態辨識有助於發現物件

卡內基梅隆大學的研究人員在計算機視覺領域取得了重要突破，他們表示相較於靜止物件，計算機視覺系統更容易檢測到運動物件，例如街上行駛的汽車或人在人行道上散步。這項研究由該校電腦科學學院院長、機器人學研究所教授 Martial Hebert 和機器人學博士生 Zhipeng Bao 與豐田研究所合作完成。該研究成果將有助於計算機和機器人更好地自動檢測影片中的物件。物件辨識是理解現實世界場景的基礎，開發運動導向的物件發現方法可能有助於自駕車技術的改進。這也可能對零售機器人、機器人操作和家用機器人等領域帶來實用價值。

MoTok：運動引導的物件辨識

卡內基梅隆大學的研究人員與豐田、加州大學伯克利分校和伊利諾伊大學香檳分校的同事合作，開發了一個名為 MoTok 的框架，該框架使計算機可以自主識別自身所看到的運動物體的特徵。MoTok 隨後利用這些特徵重建物體，使計算機能夠以一種能夠再次找到該物體的方式發現物體。研究人員後來將工作擴充套件，以使計算機能夠以簡化的虛擬方式呈現這些特徵。這一進展使計算機能夠更好地識別高級特徵，使計算機能夠分類物體，而不僅僅是識別特定物體。

從動態中視覺化物體

對人類來說視覺化物體是一種自然的能力，以至於這種能力很難自我審視。與人類不同的是，機器學習的進步幫助改善了計算機識別物體的能力。然而這些方法需要數以萬計的包含已標記物體的影片，這樣的工作費時、昂貴，而且在實驗室以外容易出錯。「顯然，這種方法不具可擴充套件性」，Hebert 表示。需要的是一種通用方法，使計算機程式能夠自行在影片中發現物體，而無需標記或監督。正如 MoTok 所展示的那樣，使用運動來引導物體發現是實現這一目標的一種方法。Bao 表示：「運動物體更容易與靜止的背景區分開來，運動還有助於定義具有多個運動部件的物體。一扇車門可能會開關，輪子可能會轉動，但當汽車沿著街道行進時，所有部件的運動協同作用可以幫助計算機程式更好地理解「汽車」這一概念。」

前景展望與建議

卡內基梅隆大學的這項研究開啟了計算機視覺領域的新篇章，為物件辨識和影片分析技術帶來了更大的可行性和發展空間。隨著自駕技術的快速發展，自動駕駛汽車需要能夠準確識別和追蹤道路上的物件，這項研究的成果為實現這一目標提供了新的方法和工具。不僅在自駕車領域，這項研究的應用還可以延伸到零售機器人、機器人操作和家用機器人等領域。例如，在零售機器人中，這一技術可以被用於確保特定產品的位置並進行庫存管理。在機器人操作和家用機器人領域，這一技術可以幫助機器人更好地理解和互動周圍環境中的物體。然而雖然這項研究為物件辨識帶來了新的技術突破，但也面臨著一些挑戰。例如，在實際應用中，仍然需要處理多種不同光線、角度和運動速度下的影片資料。此外隨著技術的應用範圍擴大，相關的倫理和隱私問題也需要得到重視。總的來說卡內基梅隆大學的這項研究為計算機視覺領域帶來了顯著的進展，對自動駕駛和機器人技術的發展具有重要意義。然而隨著技術的應用和發展，我們也需要注意相關的倫理和隱私問題，並制定相應的政策和法規來保護公眾利益。

原文： [Computer vision researchers use motion to discover objects in videos](https://techxplore.com/news/2023-07-vision-motion-videos.html)

ComputerVision-電腦視覺,動態捕獲,影片分析,物件辨識

產品管理

專案管理

Web 3

AIGC

專案故事

專案工具

網路議題

閱讀心得

軟體測試

程式筆記

職涯觀點

日常生活

市場觀察

資料收集