Stability AI 發布了最新的影象生成模型 Stable Diffusion XL 1.0
AI 新創公司 Stability AI 在面對日益激烈的競爭和倫理挑戰中不斷完善其生成式 AI 模型。今天 Stability AI 宣布推出了 Stable Diffusion XL 1.0,這是該公司迄今為止"最先進"的文字到影象模型。該模型在 GitHub 上是以開源形式提供,此外還可以透過 Stability 的 API 和使用者應用程式 Clipdrop 和 DreamStudio 使用。Stability 聲稱,相比於前一代產品,Stable Diffusion XL 1.0 在色彩、對比度、陰影和光線方面都提供了"更鮮豔"和"更精確"的表現。在接受 TechCrunch 的存取中,Stability AI 應用機器學習負責人 Joe Penna 表示 Stable Diffusion XL 1.0 包含了 35 億個引數,可以在多個長寬比下在"幾秒鐘內"生成完整的 100 萬畫素的高畫質影象。"引數"是從訓練資料中學習的模型的部分,基本上決定了該模型在問題上的技能,也就是在這個案例中生成影象的能力。Stable Diffusion XL 0.9 是上一代的產品,它也能產生更高解析度的影象,但需要更多的計算能力。Penna 表示 Stable Diffusion XL 1.0 可以進行定制,可以進行概念和風格的微調。"它也更易於使用,可以透過基本的自然語言處理提示進行複雜的設計"。此外 Stable Diffusion XL 1.0 在文字生成方面也有所改進。許多最佳文字到影象模型在生成影象時往往無法生成易於辨識的商標,更不用說書法或字型了。Penna 表示 Stable Diffusion XL 1.0 可以進行"先進"的文字生成,並具有易讀性。
倫理挑戰和著作權問題
然而與 Stable Diffusion 的先前版本一樣,該模型引發了一些棘手的道德問題。理論上,Stable Diffusion XL 1.0 的開源版本可以被惡意使用來生成有害的內容,比如非自願的深度偽造。這部分是由於用於訓練的資料:來自網路的數百萬張圖片。無數的教程展示了如何使用 Stability AI 自己的工具(包括 Stable Diffusion 的前端 DreamStudio)來製作深度偽造影象。還有無數教程展示如何微調基於 Stable Diffusion 的模型來生成色情影象。Penna 並不否認濫用的可能性,並承認該模型也具有一定的偏見。但他補充說,Stability AI 已經採取了"額外的措施"來減少有害內容的生成,例如對模型的訓練資料進行了"不安全"的過濾,發布了與問題提示相關的新警告,並盡可能地在工具中阻止個別的問題術語。Stable Diffusion XL 1.0 的訓練集還包括了一些藝術作品,這些藝術家曾抗議 Stability AI 等公司使用他們的作品作為生成式 AI 模型的訓練資料。Stability AI 聲稱,在美國至少,它受到合理使用原則的法律免責保護。但這並沒有阻止幾位藝術家和股票圖片公司 Getty Images 提起訴訟以阻止這種做法。Stability AI 與新創公司 Spawning 合作,以尊重這些藝術家的"退出"要求,公司表示它尚未從訓練資料集中刪除所有被標記的作品,但"繼續納入藝術家的要求"。Penna 表示"我們不斷改進 Stable Diffusion 的安全功能,並認真地繼續在這些措施上進行迭代。此外我們承諾尊重藝術家的要求,將其從訓練資料集中刪除"。
Stable Diffusion XL 1.0 的新功能和合作
與 Stable Diffusion XL 1.0 的發布相關,Stability AI 正在 beta 版本中推出一個用於其 API 的微調功能,使用者可以只使用五張圖片來對特定人物、產品等進行"專門化"生成。該公司還將 Stable Diffusion XL 1.0 引入 Bedrock,亞馬遜的用於託管生成式 AI 模型的雲平臺,這擴大了它先前宣布的與 AWS 合作的範圍。Stability AI 加快與合作夥伴的合作和開發新功能,是因為其商業業績出現了低迷。今年 4 月,Semafor 報導說,Stability AI 到當前為止已經籌集了超過 1 億美元的風險投資,但依然在快速消耗資金,這促使該公司在 6 月份增發了 2500 萬美元的可轉換票據,並尋求高管來幫助提高銷售業績。Stability AI 的執行長 Emad Mostaque 在新聞稿中表示:"最新的 SDXL 模型代表了 Stability AI 創新素養的下一步以及提供 AI 社區最尖端的開放存取模型的能力。在亞馬遜的 Bedrock 上揭開 1.0 的面紗,顯示了我們與 AWS 共同致力於為開發人員和客戶提供最佳解決方案的決心"。
ArtificialIntelligence-AI,影象生成模型,StableDiffusionXL1.0
延伸閱讀
- Google I/O 2024:AI 與 Android 大揭祕
- Google 在 I/O 主題演講中提到「AI」超過 120 次
- OpenAI 考慮允許 AI 色情內容?
- 資料科技公司 Daloopa 開發 AI 以自動化財務分析工作
- 今年的 Met Gala 主題是 AI 極深假裝
- Y Combinator 幫助醫療記錄 AI 新創 Hona 募得 300 萬美元 的故事
- Pinterest AI 打造的拼貼圖比單張針腳更吸睛
- Atlassian 推出新的 AI 同事 Rovo
- 三星的營運利潤飆升 930%,AI 動能帶動記憶晶片需求
- GitHub 推出 Copilot Workspace:AI 驅動的軟體工程空間