網路議題

工程師們尋找了一個古老來源,啟發電腦視覺的未來

工程師尋找古老來源,授予電腦視覺未來力量由亞當·哈德哈齊(Adam Hadhazy),普林斯頓大學報導普林斯頓大學的研究人員開發了一套開源軟體系統,可以生成無限多的自然風景的照片寫實場景,這項進展可以改善自動駕駛汽車和其他機器的訓練。該研究的一位作者、普林斯頓大學電腦科學副教授賈騰(Jia Deng .... (往下繼續閱讀)

分享到 Facebook 分享到 Line 分享到 Twitter

文章目錄

工程師們尋找了一個古老來源,啟發電腦視覺的未來

工程師尋找古老來源,授予電腦視覺未來力量

由亞當·哈德哈齊(Adam Hadhazy),普林斯頓大學報導

普林斯頓大學的研究人員開發了一套開源軟體系統,可以生成無限多的自然風景的照片寫實場景,這項進展可以改善自動駕駛汽車和其他機器的訓練。該研究的一位作者、普林斯頓大學電腦科學副教授賈騰(Jia Deng)表示這種新系統稱為 Infinigen,它依靠數學來建立三維自然物體和環境。

Infinigen 的數學方法

Infinigen 是一個程式生成器,這在電腦科學中表示根據自動化的、人為設計的演算法建立內容的程式,而不是依靠耗時的手動資料輸入或現代人工智慧的神經網路。透過這種方式,新的程式使用隨機化的數學規則創造無數的三維物體。Infinigen 是一個用於建立無限多樣且逼真自然場景的動態程式。

Infinigen 的應用價值

Infinigen 的數學方法可以生成帶有標籤的視覺資料,這對於訓練計算機視覺系統非常重要,包括部署在家庭機器人和自動駕駛汽車上的系統。因為 Infinigen 程式自動生成每個影象,包括首先建立一個三維世界,然後在其中放置物體和相機拍攝照片。Infinigen 可以自動提供有關每個影象的詳細標籤,包括每個物體的類別和位置。然後可以使用帶有自動標籤的影象來訓練機器,只需輸入影象就可以辨識和定位物體。根據賈騰的說法,使用現有的人工智慧影象生成器無法實現這種帶有標籤的視覺資料,因為這些程式使用的是深度神經網路,無法提取標籤。

此外 Infinigen 的使用者可以對系統的設定進行細微調整,例如精確的照明和觀察角度,並且可以進一步調整系統,使影象在訓練資料中更有用。除了生成由數位物體組成的虛擬世界,具有自然形狀、大小、紋理和顏色外,Infinigen 的功能還可以擴充套件到合成自然現象的表示包括火、雲、雨和雪。

Infinigen 的優勢和應用

用於建立 Infinigen 的電腦科學方法來自於 1990 年代的 Blender。與 Blender 的原創精神保持一致,普林斯頓大學的研究人員已經根據 GPL-compatible 許可證公開了 Infinigen 的程式碼,這意味著任何人都可以自由使用它。Infinigen 的關鍵優勢之一是可以從僅有的二維畫素重建複雜空間的三維表示。雖然將現實世界的影象轉為合成影象來開發將在現實世界中移動的汽車和機器人可能看起來違反直觀,但是現有的物件有局限性,因為指導機器人和智慧汽車的電腦不像人類那樣感知影象和其他視覺物件。對於機器人以 3D 方式感知影象,影象需要包含一個名為「3D ground truth」的指令。這一點對於現有的 2D 影象來說很難做到,但對於 Infinigen 這樣的系統卻易如反掌。賈騰解釋道:“對於 3D 影象的合成資料集一開始就顯示出了巨大的潛力,而我們開發 Infinigen 就是為了進一步實現這一潛力。”

思考與評論

Infinigen 的開發將為計算機視覺領域帶來重大的突破。它透過數學方法生成無數的自然寫實影象,並能夠為這些影象提供標籤,將大大提高計算機視覺系統的訓練效果。相比於現有的人工智慧影象生成器,Infinigen 的優勢在於生成的影象能夠提取標籤,使得這些影象在訓練機器時更加有用。

此外 Infinigen 提供了對系統設定的細微調整,使得使用者能夠根據特定任務的需求調整影象的真實度,進一步提高訓練資料的效果。該系統的應用價值不僅局限於計算機視覺,還可以應用於增強現實、虛擬現實、遊戲開發、電影製作、3D 列印等領域,為這些領域的使用者提供有用的工具。

結語和建議

Infinigen 的開源授權將大大促進它的發展和應用。作為一個協作工具,它可以逐步增加更多的功能,並吸引更多的使用者參與其中。我們可以預見到,Infinigen 將成為計算機視覺訓練資料的首選平臺,無論任務的性質如何。我們期望 Infinigen 能成為一個由社區驅動的專案,為廣大使用者提供一個有用的工具。

然而儘管 Infinigen 具有極大的潛力,但我們還是需要謹慎應用它。在使用 Infinigen 生成的影象作為訓練資料時,需要進一步取證和測試,以確保訓練出來的機器在實際應用中能夠準確地感知和辨識真實世界中的物體。

Technology-工程師,古老來源,電腦視覺,未來
程宇肖

程宇肖

Reporter

大家好!我是程宇肖,我對於科技的發展和應用有著濃厚的興趣,並致力於將最新的科技趨勢和創新帶給大家。科技領域的變化速度驚人,每天都有令人興奮的新發現和突破。作為一名部落格作者,我將帶領大家深入探索科技的奧秘和應用的無限可能。