
穩定 AI 發布 AI 音樂生成器,《穩定音訊》能夠生成高品質音樂
簡介
穩定 AI(Stability AI)於近日推出了稱為《穩定音訊》(Stable Audio)的首個 AI 音樂生成器,該工具聲稱是透過一種稱為潛在擴散(latent diffusion)的技術,能夠建立出商業使用的「高品質」44.1 kHz 音樂。穩定 AI 表示《穩定音訊》的基礎模型擁有大約 12 億個引數,這使得生成的音訊能夠更好地控制內容和長度,相比之前發布的其他 AI 音樂生成工具更具優勢。穩定 AI 的音訊團隊在《穩定音訊》之前還建立了一個名為《Dance Diffusion》的模型,並且該團隊在稱為 Harmonai 的模型進行訓練。總體而言,穩定 AI 希望透過這些音訊生成工具實現多模態(multimodality)的生成人工智慧(generative AI)。
討論
穩定 AI 這次推出的《穩定音訊》是其在音樂領域的重大嘗試,也代表著在 AI 音樂創作工具這一新興領域中的重要投資。相比於現有的音樂生成模型,《穩定音訊》透過潛在擴散技術改進了生成音訊的品質和持續性。不僅如此,《穩定音訊》還具有更好的控制性,能夠根據使用者的文字提示以及設定的持續時間來生成音訊。儘管這些 AI 生成的音樂還存在創造力不足的問題,但它們在感知上表現出了更強的一致性、旋律性和音樂性。
需要注意的是,爲了獲得最好的生成效果,《穩定音訊》需要根據生成歌曲的細節來設計提示,例如音樂型別、節奏、主要樂器以及歌曲所傳達的情感。對於使用者來說在使用《穩定音訊》之前必須花費一些工程上的努力,以確保生成的音樂符合預期。
《穩定音訊》是可透過 Web 應用程式使用的,但穩定 AI 並沒有公開計劃將其背後的模型以開源方式發布。針對這一點,一些支援開放研究理念的人可能會感到失望。然而穩定 AI 表示將在未來採取相應的措施來確保 AI 生成的內容的真實性和水印識別。
社論與建議
AI 生成音樂正逐步變得越來越流行,並應用於各種場景,如廣告、電影和遊戲配樂等。然而隨著 AI 技術的發展,我們也面臨一些問題和挑戰。其中一個重要問題是版權和智慧財產權的問題。儘管現有的版權法尚未明確規定 AI 生成的音樂是否侵犯了藝術家、音樂唱片公司和其他權利所有人的版權,但這確實是一個需要關注和解決的問題。
穩定 AI 在這方面提出了一些解決方案,例如將使用者的生成作品單獨保護,並提供商業使用的授權和報酬機會。然而我們仍然需要更多的討論和設定規則,以保障參與 AI 音樂生成的各方的權益。這可能需要政府、相關企業和藝術家組織之間的合作和協商。
同時對於使用者來說使用 AI 音樂生成工具可能需要一些技術知識和努力,以確保生成的音樂符合預期。我們建議使用者在使用這些工具時,透過合理設計提示和文字描述,以獲得更好的生成結果。
總體而言,《穩定音訊》的推出代表著 AI 音樂生成領域的一個重要進展,同時也帶來了許多問題和挑戰。我們希望相關方面能夠進一步加固合作,制定更全面的規範,以達到更好的平衡,確保 AI 技術的應用能夠為藝術家、音樂唱片公司和使用者帶來共贏的結果。
延伸閱讀
- 加州新 AI 法案出爐,SB 1047 作者再推出改革措施!
- 《超級瑪利歐成為 AI 基準測試的新標準!你絕對想不到的理由》
- Google 推出 SpeciesNet:專為識別野生動物而設的人工智慧模型!
- 安瑟普提克獲得 35 億美元巨額資金 瞄準人工智慧未來!
- OpenAI 重磅推出 GPT-4.5:歷史上最大的語言模型來了!
- 探索 DeepSeek:你必須理解的 AI 聊天機器人應用全指南!
- OpenAI 的創業帝國:揭密其風投基金背後的諸多創新公司
- 揭開 Mistral AI 的神祕面紗:揭示 OpenAI 競爭者的所有祕密!
- 未來科技:研究人員揭示如何打造變形機器人,猶如 T-1000 般神奇!
- ElevenLabs 推出全新語音轉文字模型,引領 AI 語音技術的新潮流!