穩定 AI 發布 AI 音樂生成器,《穩定音訊》能夠生成高品質音樂
簡介
穩定 AI(Stability AI)於近日推出了稱為《穩定音訊》(Stable Audio)的首個 AI 音樂生成器,該工具聲稱是透過一種稱為潛在擴散(latent diffusion)的技術,能夠建立出商業使用的「高品質」44.1 kHz 音樂。穩定 AI 表示《穩定音訊》的基礎模型擁有大約 12 億個引數,這使得生成的音訊能夠更好地控制內容和長度,相比之前發布的其他 AI 音樂生成工具更具優勢。穩定 AI 的音訊團隊在《穩定音訊》之前還建立了一個名為《Dance Diffusion》的模型,並且該團隊在稱為 Harmonai 的模型進行訓練。總體而言,穩定 AI 希望透過這些音訊生成工具實現多模態(multimodality)的生成人工智慧(generative AI)。討論
穩定 AI 這次推出的《穩定音訊》是其在音樂領域的重大嘗試,也代表著在 AI 音樂創作工具這一新興領域中的重要投資。相比於現有的音樂生成模型,《穩定音訊》透過潛在擴散技術改進了生成音訊的品質和持續性。不僅如此,《穩定音訊》還具有更好的控制性,能夠根據使用者的文字提示以及設定的持續時間來生成音訊。儘管這些 AI 生成的音樂還存在創造力不足的問題,但它們在感知上表現出了更強的一致性、旋律性和音樂性。 需要注意的是,爲了獲得最好的生成效果,《穩定音訊》需要根據生成歌曲的細節來設計提示,例如音樂型別、節奏、主要樂器以及歌曲所傳達的情感。對於使用者來說在使用《穩定音訊》之前必須花費一些工程上的努力,以確保生成的音樂符合預期。 《穩定音訊》是可透過 Web 應用程式使用的,但穩定 AI 並沒有公開計劃將其背後的模型以開源方式發布。針對這一點,一些支援開放研究理念的人可能會感到失望。然而穩定 AI 表示將在未來採取相應的措施來確保 AI 生成的內容的真實性和水印識別。社論與建議
AI 生成音樂正逐步變得越來越流行,並應用於各種場景,如廣告、電影和遊戲配樂等。然而隨著 AI 技術的發展,我們也面臨一些問題和挑戰。其中一個重要問題是版權和智慧財產權的問題。儘管現有的版權法尚未明確規定 AI 生成的音樂是否侵犯了藝術家、音樂唱片公司和其他權利所有人的版權,但這確實是一個需要關注和解決的問題。 穩定 AI 在這方面提出了一些解決方案,例如將使用者的生成作品單獨保護,並提供商業使用的授權和報酬機會。然而我們仍然需要更多的討論和設定規則,以保障參與 AI 音樂生成的各方的權益。這可能需要政府、相關企業和藝術家組織之間的合作和協商。 同時對於使用者來說使用 AI 音樂生成工具可能需要一些技術知識和努力,以確保生成的音樂符合預期。我們建議使用者在使用這些工具時,透過合理設計提示和文字描述,以獲得更好的生成結果。 總體而言,《穩定音訊》的推出代表著 AI 音樂生成領域的一個重要進展,同時也帶來了許多問題和挑戰。我們希望相關方面能夠進一步加固合作,制定更全面的規範,以達到更好的平衡,確保 AI 技術的應用能夠為藝術家、音樂唱片公司和使用者帶來共贏的結果。Technology-人工智慧,AI 音樂生成器,穩定,大熱
延伸閱讀
- OpenAI 揭開 AI 祕密指令的面紗
- AI 助您創辦者更快、更輕鬆地籌集資金嗎?
- 盧西德機器人獲得 900 萬美元用於無人機清潔任何地方
- 以色列新創公司 Panax 籌集了 1,000 萬美元 A 輪融資,用於其基於人工智慧的現金流管理平臺
- Reddit 測試使用基於 LLM 的人工智慧進行自動整站法語翻譯
- 三星醫聲將以 9270 萬美元收購法國人工智慧超聲波新創公司 Sonio
- 網際網路共同創始人 Robert Kahn 早在幾十年前就已經做到了加密、人工智慧和網際網路嗎?
- 人聲 vs AI:Audible 推出 AI 旁白有機會取代人類旁白嗎?
- 突破獨家訪談:Wayve 共同創辦人 Alex Kendall 談自動駕駛汽車和機器人的未來
- Rad AI 完成由 Khosla Ventures 領投的 5 千萬美元 B 輪融資