中國生成影片競賽加速升溫
樓盧仔報導
中國網路巨頭騰訊於週一推出了其開源影片生成模型 DynamiCrafter 的新版本,再度引發了人們對於中國科技巨頭在文字和影象轉影片領域潛在影響的討論。DynamiCrafter 是透過擴散方法將字幕和靜止影象轉換成為幾秒鐘長的影片,其像其他生成影片工具一樣,受到物理學中擴散現象的啟發。擴散模型在機器學習中能夠將簡單的資料轉換為更復雜、更真實的資料,就像粒子從高濃度區域轉移到低濃度區域一樣。
擴散過程也是機器學習中的一個重要方法,DynamiCrafter 的第二代模型影片畫面的畫素解析度從最初版本的 320×512 升級到了 640×1024。DynamiCrafter 團隊發表的一篇學術論文指出,其技術與競爭對手不同之處在於它將影象動畫技術的應用擴充套件到了“更一般的視覺內容”,而傳統技術主要專注於模擬自然場景和特定領域運動的動態。
技術差異
團隊指出,其關鍵想法是利用文字到影片擴散模型的運動先驗,透過將影象納入生成過程中作為引導。相比之下,“傳統”技術主要集中於使用隨機動力學(如雲和流體)或特定領域運動(如人髮或身體運動)來模擬自然場景。
市場競爭
雖然生成影片技術仍處於發展初期,但從諸多跡象來看,許多初創企業和科技巨頭都將其視為 AI 競賽的下一個焦點。除了騰訊外,位元組跳動旗下的抖音、百度和阿裏巴巴分別推出了他們的影片擴散模型。而在中國這個開放原始碼模式日益普遍的情況下,阿裏巴巴更是將其 VGen 影片生成模型開源,希望能夠觸及全球開發者社區。
這是一個令人振奮的時刻,AI 技術在不斷向前推進。然而我們也應該警惕這些技術可能帶來的影響和風險。該如何在追求技術進步的同時保持對社會和個人隱私權的尊重,這是我們需要深入討論和反思的問題。
延伸閱讀
- X 公司即將推出影片的電視應用程式
- 蘋果因應國家命令,將 WhatsApp 和 Threads 從中國 App Store 下架
- Orbex 新一輪融資或加速其 Prime 微型運載火箭進入軌道
- Storiaverse 推出短篇故事應用程式,結合影片與文字內容
- 土耳其新的遊戲專注型風險投資公司展示遊戲產業持續升溫
- TikTok 遭禁?美國政府施壓出售,風波持續升溫
- 區塊鏈新創 Sei Labs 推出引人注目的解決方案,加速以太坊交易
- Google Play 將展示遊戲的人工智慧常見問題和最新 YouTube 影片
- 阿裏巴巴員工透露中國建立 LLM 的生活點滴
- 中國的月球 AI 獲得 25 億美元估值,籌得 10 億美元用於致力於長文字上下文的 LLM 領域