Meta 的 AI 音樂生成器:新一代合成器還是廉價音樂?
AI 音樂生成器開創新紀元
最近,Meta 發布了一個名為 AudioCraft 的開源 AI 模型,這使得使用者可以完全透過生成 AI 來創作音樂和聲音的生成器。AudioCraft 包含三個 AI 模型,每個模型都處理音效生成的不同方面。MusicGen 使用文字輸入來生成音樂。該模型是透過「針對此目的而擁有的由 Meta 擁有或專門授權的 20,000 小時音樂」進行訓練的。AudioGen 透過書面提示建立聲音,例如狗叫聲或腳步聲,其訓練資料來自公開的音效。Meta 改進了其 EnCodec 解碼器的版本,使使用者能夠以更少的失真建立聲音——當你對音訊進行過多操作時,就會出現失真。該公司讓媒體聆聽了一些使用 AudioCraft 生成的示例音訊。所生成的口哨聲、警報聲和嗡嗡聲聽起來相當自然。雖然歌曲上的吉他弦聽起來真實,但它們仍然感知,嗯,人造。Meta 只是最新一家進軍音樂和 AI 結合領域的公司。Google 開發的 MusicLM 是一個大型語言模型,它基於文字提示生成數分鐘的聲音,當前只對研究人員開放。然後,在一首帶有 Drake 和 The Weeknd 聲音的“由 AI 生成”的歌曲在被刪除之前在網上爆紅。最近,一些音樂家,如 Grimes,鼓勵人們在 AI 生成的歌曲中使用自己的聲音。當然音樂家們早就開始嘗試電子音訊音樂了,EDM 和 Ultra 等音樂節也不是突然出現的。但是計算機生成的音樂聽起來往往是從現有音訊中操縱出來的。AudioCraft 和其他生成 AI 產生的音樂僅透過文字和大量音訊資料建立這些聲音。就當前而言,AudioCraft 聽起來更像是可以用於電梯音樂或股票音樂,用於營造氛圍,而不是下一首流行熱門歌曲。然而 Meta 相信他們的新模型可以像合成器一樣,在其受歡迎後掀起新的歌曲浪潮。該公司在其部落格中表示:“我們認為 MusicGen 可以成為一種全新的樂器,就像合成器剛出現時一樣。”Meta 承認,建立能夠制作音樂的 AI 模型的困難在於,音訊通常包含的行動點數比像 Llama 2 這樣的文字模型要多出數以百萬計。該公司表示為了多元化訓練資料,AudioCraft 需要開源。“我們認識到用於訓練我們模型的資料集缺乏多樣性。特別是,用於訓練的音樂資料集中包含了更大比例的西式音樂,而且只包含了文字和後設資料以英文撰寫的音訊-文字對”,Meta 表示。“透過分享 AudioCraft 的程式碼,我們希望其他研究人員可以更輕鬆地測試約束或消除生成模型中潛在偏見和濫用的新方法。”唱片公司和藝術家已經對 AI 的危險發出了警示,因為許多人擔心 AI 模型會接收版權材料進行訓練,從歷史上看,他們具有訴訟習慣。我們都還記得發生在 Napster 的事情,但最近,Spotify 也面臨了一起價值十億美元的訴訟,其根據一項早在自動鋼琴時代就存在的法律提起,就在今年,法院不得不判斷 Ed Sheeran 是否抄襲了 Marvin Gaye 的《Thinking Out Loud》。但在 Meta 的“合成器”開始巡回演出之前,有人必須找出一個能吸引更多想要機器製造的歌曲而不僅僅是背景音樂的粉絲的提示。
AI 音樂的潛力與爭議
隨著 AI 技術在音樂創作領域的激增,Meta 推出了其 AI 音樂生成器 AudioCraft。這一新的開源模型引發了人們對於 AI 音樂的潛力和爭議的探討。
第一個 AI 模型 MusicGen 可以透過文字輸入生成音樂。這一模型是透過針對此目的而擁有的由 Meta 擁有或專門授權的 20,000 小時音樂進行訓練的。另一個 AI 模型 AudioGen 則是透過書面提示建立聲音效果,如狗叫聲或腳步聲。Meta 進一步改進了其 EnCodec 解碼器,使生成的聲音更加真實,少了許多人為操作帶來的失真。
然而 AI 音樂在生成過程中還面臨著一些挑戰。音樂的結構和表達方式往往比文字更加複雜,並且聲音中具有的行動點數也更多。這使得建立能夠像合成器一樣創新的 AI 模型變得困難。
開源與多樣性訓練資料
Meta 承認,使用於訓練其模型的資料集缺乏多樣性。音樂資料集主要包含西式音樂,且文字和後設資料都是以英文撰寫的。因此 Meta 希望透過開源 AudioCraft 的程式碼,讓其他研究人員能更輕鬆地測試新的方法來約束或消除在生成模型中潛在的偏見和濫用問題。
版權和法律問題
然而 AI 音樂也引發了一些版權和法律問題。許多唱片公司和藝術家擔心 AI 模型可能使用版權材料進行訓練,而根據歷史經驗,這些行業往往是具有訴訟習慣的。過去曾發生過許多侵犯音樂版權的案例,並且在當今數位化時代,這些問題變得更加複雜。唱片公司和藝術家需要找到方法來保護他們的權益,同時讓 AI 音樂得以發展。
開創新音樂浪潮的 AI 音樂生成器?
當前看來,AudioCraft 聽起來更像是用於背景音樂或輕柔音樂的工具,而不是下一個流行音樂的革命。然而 Meta 相信其新模型可以像合成器一樣,將 AI 音樂生成器帶入全新的音樂領域。
合成器的出現曾經改變了音樂,讓音樂家有了更多的創作可能性。Meta 希望 AudioCraft 能成為一種新型樂器,將 AI 技術引入音樂創作中,並開創全新的音樂浪潮。
編者按
AI 音樂生成器 AudioCraft 的出現引發了對於 AI 在音樂創作領域的潛力和爭議的討論。這一開源模型可以透過文字輸入創作音樂和聲音效果,但其音樂的真實性和創新性仍然有待發展。此外 AI 音樂生成器還面臨著版權和法律問題,需要找到平衡音樂家和唱片公司權益以及 AI 技術發展的方法。儘管如此 Meta 相信 AudioCraft 可以成為一種新型樂器,開創新的音樂浪潮。
對於音樂家和音樂產業的人來說現在是思考如何與 AI 技術共同發展的時候了。AI 音樂生成器為音樂創作帶來了全新的可能性,但在開發和使用過程中,仍然需要謹慎處理版權和法律問題,以確保公平和合法的使用。在 AI 音樂生成器逐步成熟之前,我們還需要一段時間來探索和討論如何將 AI 技術融入音樂創作中,並找到平衡點,讓機器生成的音樂成為人們喜愛的音樂。
延伸閱讀
- 深度學習技術進步!Meta 推出廣告 AI 工具,能創造全新影象而非僅替換背景
- Meta 推出的 AI 工具現在能夠創造全新的影象,而非僅僅是更換背景
- 任天堂正式確認新一代 Switch 即將推出
- Meta 在歐盟調查 Facebook 和 Instagram 的背景下應對選舉安全
- Meta 宣布為 Threads 上的創作者推出獎勵計劃
- 為何 Meta 看好 fediverse 作為社交媒體的未來
- 歐盟對 Meta 監視廣告模式實施更嚴格管制
- Meta 開放 Quest OS 給第三方耳機製造商,與聯想和 Xbox 合作夥伴關係
- 元宇宙新趨勢:Meta 推出全新 Llama 3 機型,為開源人工智慧注入動力
- Meta 將 Llama 3 智慧聊天機器人整合到其應用程式的搜尋欄位