新聞評論:AI 模型促進進階模式生成
傳達物理學智慧,推進人工智慧發展
最近,麻省理工學院(MIT)的研究人員在生成式人工智慧領域取得了一項重大突破。他們成功將兩個貌似無關的物理定律-擴散和泊松流納入新的 AI 模型,使其在生成新影象方面表現優於現有的頂尖模型。應用這種模型,科學家可以生成各種複雜的圖案,包括逼真的影象和模擬真實世界過程的模式。這項突破將為影象和模式生成提供更有效的方法,標誌著技術發展的重要一步。
集合物理定律和人工智慧的力量
這一創新模型稱為「泊松流模型++」(PFGM++),其基礎是去年 MIT 團隊的工作「泊松流生成模型」(PFGM)。PFGM 模型以數學方程式「泊松方程」背後的方式啟發,並將其應用到模型嘗試學習的資料中。為了實現這一點,團隊使用了一個巧妙的技巧:他們在模型的「空間」中新增了一個額外的維度,就像從 2D 草圖轉變為 3D 模型一樣。這個額外的維度為模型提供了更多的機動空間,將資料放在更大的背景中,在生成新樣本時可以從各個方向進行探索。
PFGM++模型透過將 PFGM 的電場拓展到一個複雜的高維度框架,將 PFGM 和擴散模型結合起來。在拓展這些維度時,出現了一些意想不到的情況-模型開始類似於另一類重要的模型,即擴散模型。
這一創新使得 PFGM++模型成為一個平衡點,可以在健壯性和易用性之間取得平衡。它提供了更為高效的影象和模式生成,為技術發展帶來了重要的一步。
物理智慧:為人工智慧領域帶來變革
PFGM++模型的創新之處在於它將物理定律和人工智慧的概念融合在一起,實現了生成複雜模式的嶄新方法。麻省理工學院的 Jesse Thaler 在評論中表示「近年來基於人工智慧的生成模型取得了驚人的成果,從逼真的影象到流暢的文字。值得注意的是,一些最強大的生成模型基於物理學中經過時間取證的概念,例如對稱性和熱力學。PFGM++將物理學百年來的想法——可能存在額外的時空維度——轉化為一種強大而穩健的生成合成資料集的工具。我很高興看到'物理智慧'正在改變人工智慧領域的眾多方式」。
未來展望
麻省理工學院的研究人員計劃在 PFGM++模型中進一步完善某些方面,特別是對特定資料、結構和任務定制的 D 值進行系統性的研究,以提高模型效能。他們還計劃將 PFGM++應用於現代大規模文字到影象/影片生成。
總的來說這項研究拓展了運用物理智慧來推動人工智慧發展的可能性。PFGM++模型的成功表明,透過結合不同領域的知識和技術,我們可以創造出更先進的 AI 模型,並為我們的生活帶來更多創新和可能性。
延伸閱讀
- Google 推出新一代 AI 模型 LearnLM,助力教育業界革新
- 亞馬遜推出 Bedrock Studio:簡化生成式人工智慧應用開發
- 本週人工智慧大事記:生成式人工智慧與創作者補償的問題
- Dropbox、Figma CEO 支援 Lamini:新創公司打造企業專用生成式人工智慧平臺
- 亞馬遜計劃託管企業定製的生成式人工智慧模型
- Google 雲端大會:Google 全力開發生成式人工智慧
- Google 將生成式人工智慧技術注入其雲安全工具
- Fireworks.ai 開源 API 讓生成式人工智慧適用於任何開發者
- NFT 平臺 Zora 提供了一種新的賺錢方式,適合 AI 模型製作者
- Brain.ai:生成式人工智慧系統統一作業系統