網路議題

AI 影像生成的穩定性升級,全新穩定擴散基礎模型提供更精準的影象構圖

Stability AI 推出新版文字生成影象基模型,為 AI 生成影象帶來穩定性升級今日,Stability AI 宣布推出 Stable Diffusion XL(SDXL)1.0,這是一款全新的文字生成影象模型,以改善影象品質和使用者生成高度詳細影象的能力。這次的發布是 Stability A .... (往下繼續閱讀)

分享到 Facebook 分享到 Line 分享到 Twitter

文章目錄

AI 影像生成的穩定性升級,全新穩定擴散基礎模型提供更精準的影象構圖

Stability AI 推出新版文字生成影象基模型,為 AI 生成影象帶來穩定性升級

今日,Stability AI 宣布推出 Stable Diffusion XL(SDXL)1.0,這是一款全新的文字生成影象模型,以改善影象品質和使用者生成高度詳細影象的能力。這次的發布是 Stability AI 為了應對 Midjourney 和 Adobe 等競爭對手的挑戰,加固其能力並開放模型的結果。

進一步提升影象品質和節省努力的 SDXL 1.0

SDXL 1.0 帶來了多項改進,其中之一是改進的影象精煉過程,Stability AI 聲稱相較於之前的 Stable Diffusion 模型,它可以生成更豐富的色彩、光線和對比度。此外 SDXL 1.0 還引入了微調功能,使使用者可以更輕鬆地建立高度定制的影象。

基於 3.5 億引數基模型的 SDXL 1.0

SDXL 1.0 採用高度最佳化的訓練方法開發,基模型擁有 35 億引數。Stability AI 將其定位為一個堅實的基模型,預計將建立一個工具和功能生態系統。

Stability AI 的執行長 Emad Mostaque 在接受 VentureBeat 的採訪中表示:“基模型非常有趣,就像 Minecraft 發布一樣,整個社區即便出現了模改社群,你可以看到在 Stable Diffusion 社群中的豐富性。但你需要一個非常堅實的基礎來構建。”

SDXL 1.0 中改進的微調功能

通常,使用文字生成影象的過程需要迭代,SDXL 1.0 旨在使這個過程更加輕鬆。Mostaque 表示:“用於微調的影象數量大幅下降。現在只需使用五到十張影象,就可以快速微調一個出色的模型。”

SDXL 1.0 中實現了更容易微調和改進合成的關鍵創新技術被稱為“ControlNet”。斯坦福大學早些時候發表的一篇研究論文詳細介紹了這一技術。Mostaque 解釋說,ControlNet 可以將輸入(例如骨架影象)對映到基礎擴散噪聲基礎架構,以提高準確性和控制度。

SDXL 1.0 的更多引數對於模型準確性的重要性

Mostaque 談到推動生成式 AI 繁榮的一個關鍵因素就是模型的縮放,透過增加引數數量來增加特徵和知識的數量。Mostaque 表示基於 SDXL 1.0 的基本模型中的 35 億引數可以提供更好的整體準確性。“您可以教模型各種各樣的東西,而且教得更深入,引數數量的確很重要。”他說道。

雖然 SDXL 1.0 有更多引數,但它並不需要使用者輸入較長的詞語或提示來獲得更好的結果,這在文字生成模型中通常是必須的。Mostaque 表示使用 SDXL 1.0,使用者可以提供複雜的多部分指令,這些指令所需文字比以前的模型要少。以前的 Stable Diffusion 模型需要更長的文字提示。他解釋道:“這個模型不需要做那樣的事情,因為我們在 RLHF(強化學習與人類反饋)階段與社區和合作夥伴一起進行了強化學習。”

SDXL 1.0 基模型的開放性和易用性

SDXL 1.0 的基模型今天已在多個地點提供,包括 Amazon Bedrock 和 Amazon SageMaker Jumpstart 服務。“基模型是開放的,並且根據 CreativeML 的道德使用許可證提供給整個社區使用。”Mostaque 表示“Bedrock、Jumpstart 以及我們自己的 API 服務,還有我們擁有的 Clipdrop 等介面,使其易於使用,因為單獨的基模型…有些複雜。”

VentureBeat 的使命是為技術決策者提供關於企業技術轉變的知識並進行交易。你可以關注他們的相關報導,深入理解生成式 AI 的最新發展。

StabilityorAI-generatedImages-AI,影像生成,穩定性升級,擴散基礎模型,影象構圖,精準
江塵

江塵

Reporter

大家好!我是江塵,一名熱愛科技的發展和創新,我一直都保持著濃厚的興趣和追求。在這個瞬息萬變的數位時代,科技已經深入到我們生活的方方面面,影響著我們的工作、學習和娛樂方式。因此,我希望透過我的部落格,與大家分享最新的科技資訊、趨勢和創新應用。