
中國生成影片競賽加速升溫
樓盧仔報導
中國網路巨頭騰訊於週一推出了其開源影片生成模型 DynamiCrafter 的新版本,再度引發了人們對於中國科技巨頭在文字和影象轉影片領域潛在影響的討論。DynamiCrafter 是透過擴散方法將字幕和靜止影象轉換成為幾秒鐘長的影片,其像其他生成影片工具一樣,受到物理學中擴散現象的啟發。擴散模型在機器學習中能夠將簡單的資料轉換為更復雜、更真實的資料,就像粒子從高濃度區域轉移到低濃度區域一樣。
擴散過程也是機器學習中的一個重要方法,DynamiCrafter 的第二代模型影片畫面的畫素解析度從最初版本的 320×512 升級到了 640×1024。DynamiCrafter 團隊發表的一篇學術論文指出,其技術與競爭對手不同之處在於它將影象動畫技術的應用擴充套件到了“更一般的視覺內容”,而傳統技術主要專注於模擬自然場景和特定領域運動的動態。
技術差異
團隊指出,其關鍵想法是利用文字到影片擴散模型的運動先驗,透過將影象納入生成過程中作為引導。相比之下,“傳統”技術主要集中於使用隨機動力學(如雲和流體)或特定領域運動(如人髮或身體運動)來模擬自然場景。
市場競爭
雖然生成影片技術仍處於發展初期,但從諸多跡象來看,許多新創企業和科技巨頭都將其視為 AI 競賽的下一個焦點。除了騰訊外,位元組跳動旗下的抖音、百度和阿裏巴巴分別推出了他們的影片擴散模型。而在中國這個開放原始碼模式日益普遍的情況下,阿裏巴巴更是將其 VGen 影片生成模型開源,希望能夠觸及全球開發者社區。
這是一個令人振奮的時刻,AI 技術在不斷向前推進。然而我們也應該警惕這些技術可能帶來的影響和風險。該如何在追求技術進步的同時保持對社會和個人隱私權的尊重,這是我們需要深入討論和反思的問題。
延伸閱讀
- "Alexa 新功能來了!一聲令下即可快速跳轉 Prime Video 影片精彩片段"
- 阿裏巴巴聯手蘋果!新 AI 功能將在中國 iPhone 中重磅登場!
- 蘋果拒絕 DeepSeek 合作,改與阿裏巴巴攜手推進中國 AI 戰略!
- 歐盟尋求民間資助「AI 巨型工廠」,瞄準前沿人工智慧競賽!
- 數百家公司因中國資料風險封鎖 DeepSeek,背後的隱憂是什麼?
- WeDoSolar 轉型 B2B,背後是中國太陽能巨頭的戰略收購!
- 印度讚揚中國 AI 實驗室 DeepSeek,計劃將其模型本地化伺服器託管!
- 中國據傳歡迎馬斯克收購美國 TikTok!這個動作將改變遊戲規則嗎?
- 特斯拉全新外觀 Model Y 登陸中國,引發熱議!
- 中國「颱風」駭客:準備迎戰的網路軍隊!