Stability AI 公開了 Stable Audio 技術,將文字轉為音訊生成
概述
近日 Stability AI 宣布了其 Stable Audio 技術的首次公開發行。這項技術可以使任何人能夠使用簡單的文字提示生成短音訊片段。Stability AI 最聞名的是其 Stable Diffusion 文字至影象生成 AI 技術。該公司在七月份更新了其新的 SDXL 基模型,以改進影象合成。隨後,該公司在八月份推出了面向程式碼的 StableCode,將其範圍擴大到影象之外。而 StableAudio 則是一項全新的能力,雖然基於許多與 Stable Diffusion 相同的核心 AI 技術,但是使用的是音訊訓練資料,用於生成新的音訊片段。
Stable Audio 技術的執行方式
Stable Audio 透過使用擴散模型來生成新的音樂作品,而不是 MIDI 檔案。Stable Audio 技術是基於定音方式訓練的,使用的是原始音訊樣本,以產生更高質量的輸出結果。該模型訓練的資料來源是從 AudioSparks 音訊庫獲取的超過 800,000 首授權的音樂作品。Stability AI 的副總裁 Ed Newton-Rex 在接受 VentureBeat 採訪時表示:“擁有這麼多資料,非常完整的後設資料,這是做這些基於文字的模型時非常困難的事情之一,它不僅有高質量的音訊,還有良好的相應後設資料。”
Stable Audio 的約束和用途
與影象生成模型不同,Stable Audio 使用者將無法要求 AI 模型生成聽起來像經典披頭士樂曲的新音樂。Newton-Rex 指出:“我們沒有使用披頭士的音樂進行訓練。對於音樂家而言,他們一般不會要求創作出類似披頭士或其他特定音樂團體風格的作品。”根據 Newton-Rex 的經驗,在創作新音樂時,大多數音樂家更希望能夠保持創造力,而不是只是按照某個特定音樂團體的風格來生成。
提示指南和價格
Stability AI 除了公開發布 Stable Audio 技術之外,還推出了提示指南,以幫助使用者生成所需的音訊檔案。Stable Audio 將提供免費版本和 12 美元/月的 Pro 版本。免費版本每個月允許生成 20 個最長 20 秒的片段,而 Pro 版本則增加到 500 次生成和 90 秒的片段。Newton-Rex 表示:“我們希望給每個人使用這項技術的機會,讓大家能夠進行實驗。”
評論與建議
這項 Stable Audio 技術的公開發行為文字轉音訊生成帶來了新的可能性。它擴充套件了 AI 技術在音訊領域的應用,為音樂和音訊創作提供了更多可能的方向。然而我們也要警惕 AI 生成音樂的倫理和版權問題。
倫理問題
隨著 AI 技術的不斷發展,我們需要重視由 AI 生成的內容所涉及的倫理問題。例如,如果我們使用 Stable Audio 生成的音樂非常接近某個已知音樂家的風格,是否會侵犯到該音樂家的智慧財產權?這需要進一步的討論和法律界定。同時我們也需要反思由 AI 生成的音樂是否真正具有創造性以及此類技術對原創音樂創作的影響。
技術發展的提供者責任
作為 AI 技術的提供者,Stability AI 有責任確保其技術的使用符合道德和法律準則。他們應該建立良好的使用政策和監管機制,確保使用者遵守版權法律,並避免濫用 AI 生成的內容。
創新與人類創意的平衡
AI 生成音樂的興起引發了關於人類創造力和 AI 創新之間的平衡的討論。AI 可以生成具有驚人技術的音樂作品,但它是否真正具有創造性?這種平衡需要我們重視,並給予人類創意的重要性。雖然 Stable Audio 等技術提供了方便和創造的工具,但是人類創作者的創新和表達仍然是無價的。
結論
Stable Audio 技術的公開發行為文字轉音訊生成開啟了新的可能性,為音樂和音訊創作帶來了更多可能的方向。然而我們需要警惕 AI 生成音樂的倫理和版權問題,並平衡 AI 創新和人類創造力之間的關係。AI 技術的發展應該以確保人類創意和創新的保護和尊重為前提,使其成為我們社會進步的有益工具。
延伸閱讀
- Google 推出「Web」篩選器,顯示老式文字連結,AI 技術持續演進
- 人聲 vs AI:Audible 推出 AI 旁白有機會取代人類旁白嗎?
- 為什麼 RAG 無法解決生成式 AI 的幻覺問題
- CommentSold:AI 技術讓直播賣貨更加方便
- OctoAI 推出 OctoStack,讓私人 AI 模型部署更輕鬆
- AI 動力對話機器人 ChatGPT:一切你需要知道的
- Morph Studio 讓您使用 Stability AI 生成的影片製作電影
- AI 驅動的 ChatGPT:一切你需要知道的事情
- Google 推出 AI 輔助的 NotebookLM 筆記應用程式,現已開放美國使用者使用
- 組裝 AI 獲得 5000 萬美元資金,打造並提供 AI 語音模型