網路議題

使用 Neuralangelo:在智慧型手機上釋放數位米開朗基羅

神經安吉洛:讓您的智慧型手機成為數位米開朗基羅導論自從 3D 表面重建的概念出現以來,該過程一直是一項緩慢而痛苦的工作,需要進行大量的試誤和人工輸入。但是如果您能用智慧型手機拍攝一個物體或場景的影片並將其轉換為準確的、詳細的模型,就像一位大師雕塑家用大理石或黏土創作傑作一樣,該有多好呢?研究人員聲稱 .... (往下繼續閱讀)

分享到 Facebook 分享到 Line 分享到 Twitter

文章目錄

使用 Neuralangelo:在智慧型手機上釋放數位米開朗基羅

神經安吉洛:讓您的智慧型手機成為數位米開朗基羅

導論

自從 3D 表面重建的概念出現以來,該過程一直是一項緩慢而痛苦的工作,需要進行大量的試誤和人工輸入。但是如果您能用智慧型手機拍攝一個物體或場景的影片並將其轉換為準確的、詳細的模型,就像一位大師雕塑家用大理石或黏土創作傑作一樣,該有多好呢?研究人員聲稱,名為神經安吉洛(Neuralangelo)的算法正是透過神經網路的力量實現了這一目標,而且具有亞毫米的精度。這是由約翰霍普金斯大學工程學院電腦科學系的研究人員和科技巨頭 NVIDIA 公司聯合進行的專案,該高保真的神經表面重建算法能夠從智慧型手機影片或無人機影片中準確地呈現日常物體、名人雕像、熟悉的建築和整個環境的形狀,且無需額外的輸入。

背景

虛擬現實環境、自主機械人導航和智慧手術室所使用的算法都有一個基本要求:它們需要能夠處理和準確解讀現實世界的訊息才能常規工作。這種知識是透過 3D 表面重建實現的,該算法透過使用來自不同角度的多個 2D 影象來呈現現實環境,以便其他程式可以識別和操作。神經安吉洛專案的發起人是 Zhaoshuo Li,在 2019 年獲得了約翰霍普金斯大學工程學院電腦科學碩士學位,並在 2023 年獲得了電腦科學博士學位。他在 2022 年夏天實習期間在 NVIDIA 公司展開這個專案,現在他是該公司的研究科學家。他的目標不僅是改進現有的 3D 重建技術,還要使這些技術對所有人都可用,即使只有一部智慧型手機

創新與挑戰

神經安吉洛團隊在建立該算法時首先解決了早期重建算法在渲染大面積同色區域、重複紋理模式和強烈顏色變化方面遇到的問題。傳統算法使用僅檢視和比較區域性畫素區域的分析梯度,因此它們會產生表面不準確、凸起物懸浮在屋頂上的噪點,或者缺失細節的情況,比如牆上的洞。神經安吉洛團隊解釋說, "簡單的解決方案是新增手動輸入。 " "雖然那樣確實可以得到更好的結果,但達不到神經安吉洛的水平。 " 他們選擇解決問題的根本,採用了數值梯度的多解析度雜湊網格表示方法,從而顯著提高了算法的重建質量。這意味著神經安吉洛不僅僅關注區域性畫素,而且採用更綜合的方法來銳利和強化細節的表面,進一步平滑平坦的表面,同時仍捕捉到場景的所有重要細節。

優勢和應用

此外研究人員還實現了粗到細的最佳化過程。該算法從一個粗糙的雜湊解析度開始,逐步增加解析度,將更精細的細節和複雜性 "雕刻 "出來,直到實現高保真的、逼真的 3D 重建。然後,他們將該算法適應於從手動捕捉的 2D 影片中提取影象的技術。在傳統的算法面對影片藝術品(例如曝光變化,比如從直射陽光到濃重陰影的過渡)時遭遇困難時,神經安吉洛的架構天生就能夠適應這樣的變化,這些變化在現實影片拍攝中是自然發生的。團隊舉了神經安吉洛從一段兩分鐘的無人機影片中重建 Shriver Hall 外部的例子來說明其能力。捕捉手術室、街景或家中的房間等不需要昂貴的測量裝置(如鐳射雷達,往往需要數百或數千美元);您只需要使用智慧型手機相機即可獲得相同的渲染品質。當然輸入影片的質量會影響最終結果,但是智慧型手機、無人機和專業相機都可適用於該算法。

挑戰與展望

然而神經安吉洛在處理高反射表面時仍存在困難。由於其高表示能力,它往往完全重建了鏡面般的表面所反映的場景,呈現出更像是一個模型而不是一個平坦的玻璃。然而 NVIDIA 的研究團隊表示他們已經在研究中解決了這個問題。同時 Li 希望透過公開可用的源程式碼,他和整個計算機圖形學界都能夠最佳化該算法,以在幾分鐘內獲得結果。

結論

對於 3D 列印愛好者、影片遊戲和 CGI(電腦生成影象)素材設計師以及外科應用來說神經安吉洛被譽為一個令人興奮的發展。Li 甚至在他的博士論文中使用神經安吉洛,用於產生一個病人頭骨的高保真重建,以在複雜的基底手術中使用。他設想將來的擴增現實應用可以警告外科醫生他們與病人的大腦有多近,就像自動駕駛汽車的行人警告一樣。他解釋說,"對於人類來說很難量化特定的距離,無論是以米為單位還是以毫米的精度,但算法可以提供這樣的補充技能。 "神經安吉洛團隊在 2023 年 6 月底在加拿大溫哥華舉行的 2023 年計算機視覺和模式識別會議上報告了他們的研究成果,Li 表示該算法的未來已經引起了很大的關注。他將未來使用神經安吉洛的虛擬助手形容為鋼鐵俠的"賈維斯",能夠與使用者互動,提供即時反饋,並最重要的是,理解真實世界發生的事情。他說:"我們正在想像一個神經安吉洛不僅僅理解一個物體的幾何形狀,還理解它所看到的東西。"
ArtificialIntelligence-Neuralangelo,智慧型手機,數位,米開朗基羅
江塵

江塵

Reporter

大家好!我是江塵,一名熱愛科技的發展和創新,我一直都保持著濃厚的興趣和追求。在這個瞬息萬變的數位時代,科技已經深入到我們生活的方方面面,影響著我們的工作、學習和娛樂方式。因此,我希望透過我的部落格,與大家分享最新的科技資訊、趨勢和創新應用。