全新 AI 影像工具讓 2D 照片可以互動式地進行 3D 操作

新型 AI 影像工具: 可互動式 3D 操控 2D 圖片技術背景隨著人工智慧技術的發展，許多傳統行業也在進行著數位轉型。在數位影像領域中，AI 技術的應用帶來許多畫素級的處理效能，例如調整對比度、自動裁剪、模糊等等。這些技術相對簡單，而現今 AI 的應用已經開始往更複雜的影象處理技術上前進，例如在圖 .... (往下繼續閱讀)

by 程宇肖
2023/5/26
5 分鐘閱讀時間

A- A A+

文章目錄

新型 AI 影像工具: 可互動式 3D 操控 2D 圖片

技術背景

隨著人工智慧技術的發展，許多傳統行業也在進行著數位轉型。在數位影像領域中，AI 技術的應用帶來許多畫素級的處理效能，例如調整對比度、自動裁剪、模糊等等。這些技術相對簡單，而現今 AI 的應用已經開始往更複雜的影象處理技術上前進，例如在圖片生成方面，GAN（生成對抗網路）模型已經被用於生成高畫質圖片或逼真的影象資料集。而現在有一支由來自明斯特普朗克資訊學研究所、麻省理工學院、Google 和賓夕法尼亞大學的團隊開發的新型 AI 影像工具，可使使用者以互動式、3D 的方式操控 2D 圖片。

DragGAN 技術介紹

這款影像工具被稱作 DragGAN，它允許使用者用“拖曳”的方式操控透過 GAN 生成的影象。使用者只需在影象上點選幾個手柄點（紅色）和目標點（藍色），DragGAN 便會把手柄點準確移動到其相應的目標點上。使用者可以選擇在靈活的區域（亮區）上繪製遮罩，讓影象的其他部分保持不變。這種點體操控技術可以控制許多空間特徵，例如姿勢、形狀、表情和排版等。

DragGAN 技術應用

與傳統的影象處理工具相比，DragGAN 顯然有著更多的操作空間。其使用 AI 的機器學習能力進行影象識別和分析，可以推斷影象中缺失部分的外觀和內容，從而進行精確的操作。在展示 DragGAN 的短片中，我們可以看到一張哭臉的圖片被點選幾次滑鼠後，立刻轉換為笑臉的圖片。人物的臉孔也可以被旋轉，使得原本未被拍攝的部位也被體現出來。同樣的，DragGAN 也可以應用在汽車、動物、風景等各種影象型別上，而只需點選幾下就可以進行巨大改變。

DragGAN 技術深度思考

然而這種 AI 影像操控技術同時也引發了一些問題。由於 DragGAN 可以透過人工智慧模型來推算並建立鮮活的影象資訊，因此很容易將假圖或者虛假的訊息混淆進來，讓人對圖片真實性產生疑問。這也提醒我們警覺，要避免不實訊息和不道德應用。

對使用者的建議

當然如果這種技術得到合適的運用，它可以幫助許多創意行業的從業者完成他們的工作。例如，它可以用於遊戲開發，讓場景中的遊戲角色靈活地做出各式各樣的表情、姿勢和姿態。此外 DragGAN 與傳統的 2D 影象處理軟體相比，可以更準確地推斷缺失部分，讓使用者更加有效地進行編輯，也可以讓使用者更加簡便地進行影象處理。不過這種科技還有待取得更多的進展和運用。

總結

DragGAN 技術是一種嶄新的影象處理技術，這類技術的應用已經開始變得越來越普及和廣泛。透過這種技術，我們探討了技術發展帶來的好處，並警惕人們注重科技的正確應用和不道德應用所可能帶來的影響。這些議題，能夠喚起人類更深思熟慮地關注人工智慧所帶來的技術進步和社會責任。

Interactive 3D Photo Tool-AI 影像工具,2D 照片,3D 操作,互動式

產品管理

專案管理

Web 3

AIGC

專案故事

專案工具

網路議題

閱讀心得

軟體測試

程式筆記

職涯觀點

日常生活

市場觀察

資料收集