
開發人員現在使用人工智慧進行文字轉換音樂應用程式
背景
近年來隨著大型語言模型(LLM)和生成型人工智慧(AI)工具(如 ChatGPT)的流行,開發人員已經找到了各種利用情境,可以將文字以不同的方式塑造,從撰寫電子郵件到摘要文章。現在他們正試圖幫助你僅透過輸入一些文字生成音樂片段。
Songburst
Brett Bauman 是 PlayListAI(以前稱為 LinupSupply)的開發人員,他在上週在 App Store 上推出了名為 Songburst 的新應用程式。該應用程式沒有陡峭的學習曲線。你只需要輸入類似「在學習時聽的平靜鋼琴音樂」或「播客片頭的律動節拍」的提示詞,應用程式就會生成一段音樂片段。如果你無法想到提示詞,應用程式還提供了不同類別的提示詞,包括影片、lo-fi 音樂、播客、遊戲、冥想和示例。
App 的背後技術
Bauman 告訴 TechCrunch,他使用 Vercel 構建了應用程式的後端,音樂是透過 Leap 生成的。當前生成的音樂片段長度有限為 30 秒,有些輸出可能質量不佳。Bauman 表示隨著時間的推移,他將努力增加生成的音樂片段的長度並提高質量。
CassetteAI
除了 Brett Bauman,還有其他人試圖做出一個簡單易用的文字轉換音樂應用程式。比如,Akhil Tolani,他曾製作過音樂協作應用程式 Rapchat,現在推出了一款名為 CassetteAI 的應用程式,該應用程式在 Web 和 App Store 上都可使用。與其他應用程式類似,CassetteAI 在輸入層級上工作方式相似,你輸入一個音樂提示詞,它就會生成一個音樂軌。然而它可以生成高達三分鐘的樣本。該應用程式使用基於 seq2seq 層次結構的自定義模型,並經過專門的資料集訓練以生成免版稅音樂。
功能與價格
這個工具還提供了一個介面,讓使用者建立不同版本的生成軌道,並對它們進行編輯和混音來製作新的音軌。這些工具相當基本,所以暫時不要指望能夠建立多層次的主音軌。然而如果開發人員為樣本或歌曲製作過程中使用這些工具,他們希望能夠引起音樂人的注意。
Cassette AI 的 Pro 訂閱
Tolani 表示該工具現在是按照候補名單方式執行,但現在正在向更多人開放。他告訴 TechCrunch,他還為 Cassette AI 推出了一個定價為每月 4.99 美元的 Cassette AI Pro 訂閱,該訂閱將讓使用者可以無約束生成歌曲,同時獲得更好質量的 AI 模型以改善歌曲生成。開發人員提到,Cassette AI 比 Mubert 和 Beatbot 等其他音樂生成器更好,因為它能夠更快地生成更高質量的音樂。他補充說,透過 Cassette AI,他希望尊重音樂產業的倫理界線。「我們希望讓人們將 AI 視為音樂創作的工具,而不是創作者的替代品:計算器沒有取代數學家,它們只是讓計算變得更容易。我們希望使音樂製作對任何用途的每個人都能夠輕鬆接觸到。」
引起關注
這些工具主要針對創作者,他們可以在他們的影片或播客中使用無版權音樂。開發人員還希望音樂人注意到這些工具,並將它們融入到他們的樣本或歌曲製作過程中。
主要科技公司的參與
除了獨立開發人員,主要科技公司也在試圖解決文字轉換音樂的問題。Google 在五月的 Google 開發者大會上公開了 MusicLM 工具。今年六月,Facebook(Meta)開源了其自家的人工智慧音樂生成器 MusicGen。儘管生成的音軌質量越來越高,但人們對於用來生成音樂的訓練資料存在一些擔憂。為了避免法律問題,OpenAI 已將其 Jukebox 模型的部分開源,並禁止使用者以商業用途來創作音樂。
結語
文字轉換音樂的應用程式開發正在進入新的階段,從大型科技公司到獨立開發人員,各方力圖將這一技術應用於日常生活和音樂創作中。保持倫理界線的同時這些工具對於給創作者和使用者提供無版權音樂選擇以及使音樂製作變得更加普及和可接觸都有著重要的作用。然而這些應用程式的質量和訓練資料的完整性仍然是值得關注的問題,開發人員和使用者應該保持警覺並警惕使用。
延伸閱讀
- 加州新 AI 法案出爐,SB 1047 作者再推出改革措施!
- 《超級瑪利歐成為 AI 基準測試的新標準!你絕對想不到的理由》
- Google 推出 SpeciesNet:專為識別野生動物而設的人工智慧模型!
- 安瑟普提克獲得 35 億美元巨額資金 瞄準人工智慧未來!
- OpenAI 重磅推出 GPT-4.5:歷史上最大的語言模型來了!
- 探索 DeepSeek:你必須理解的 AI 聊天機器人應用全指南!
- OpenAI 的創業帝國:揭密其風投基金背後的諸多創新公司
- 揭開 Mistral AI 的神祕面紗:揭示 OpenAI 競爭者的所有祕密!
- 未來科技:研究人員揭示如何打造變形機器人,猶如 T-1000 般神奇!
- ElevenLabs 推出全新語音轉文字模型,引領 AI 語音技術的新潮流!