軟體可以從現有影片中創造全新視角
簡介
康奈爾大學和 Google 研究的研究人員開發了一種名為 DynIBar 的算法,使電影製片人能夠在不需要拍攝任何新影片的情況下,穩定抖動的影片,改變視點並創造凍結、變焦和慢動作效果。這款軟體利用原始影片的畫素訊息合成新的視角,甚至可以應對移動物體和不穩定的攝影方式。
方法
DynIBar 軟體以影象為基礎的渲染方法(image-based rendering)作為基礎。這種方法在 1990 年代就由計算機圖形學研究人員開發出來,用於渲染帶有許多小部分(如枝葉茂盛的樹)的複雜場景。該方法將場景的影象訊息儲存在源影象中,以實現快速載入。研究人員進一步發展了一種影象基礎渲染方法,用於合成靜態影象的新視角。
局限性與未來展望
儘管 DynIBar 軟體為電影製片人帶來了新的創作工具,但這些功能在不久的將來可能並不會出現在智慧手機上。即使在效能強大的計算機上,該軟體處理僅僅 10 或 20 秒的影片也需要幾小時的時間。因此研究人員認為該技術在近期可能更適合用於離線影片編輯軟體。未來的挑戰將是如何在原始影片中缺乏畫素訊息的情況下生成新的影象,例如當主體移動得太快或使用者希望旋轉視點 180 度時。研究人員預計可以結合生成式人工智慧技術,例如文字至影象生成器,來填補這些缺失。
影響與啟示
DynIBar 軟體的開發將為電影創作提供更多可能性,有望使製片人能夠更靈活地應對影片製作過程中的技術挑戰。然而我們也應該意識到這項技術所帶來的潛在風險。例如,這種軟體可能被濫用來製作虛假影片,進一步損害視聽媒體中的可信度。因此開發者和使用者都應該對這種技術進行倫理思考和回溯。
結論
DynIBar 軟體的開發是電影製片人和影片編輯人員的重大突破。該軟體在影片後期製作過程中為他們提供了更多創造性的選擇。然而我們也應該正視這項技術可能帶來的問題,特別是虛假影片的問題。開發者和使用者在應用這項技術時應該保持警惕,確保其使用在合理和倫理的範圍內。
引用來源:來源
延伸閱讀
- 元網發布 Llama 3,宣稱它是當前最優秀的開放模型之一
- 微軟拆分 Teams 可能對 Slack 的影響並非你所想像的那樣
- 「Applied Intuition 以 AI 驅動的自動駕駛軟體獲得 60 億美元估值」
- 通用汽車恢復 Chevy Blazer EV 銷售,提供全新軟體和降價計劃
- Adobe 發布音樂創作的 GenAI 工具
- Text-to-speech app Speechify 推出 Gmail 整合和語音克隆功能
- Google 推出兩款新的開放 LLM
- 福特準備下一場大戰,Waymo 召回自駕車軟體,另一家自駕車新創公司裁員
- 德國 Instagrid 使用軟體為攜帶式電池注入新動力,成功籌得 9500 萬美元
- 微軟推出 Copilot 專業方案