ElevenLabs 的語音生成工具正式推出
ElevenLabs 推出正式版語音生成工具,支援超過 30 種語言
ElevenLabs 是一個利用人工智慧技術建立合成音訊的平臺,今天正式推出了它的語音生成工具。該公司表示借助內部開發的新人工智慧模型,其工具現在能夠自動識別包括韓語、荷蘭語和越南語在內的超過 30 種語言,並以這些語言生成“情感豐富”的語音。在新模型的加持下,ElevenLabs 的客戶可以利用該平臺的語音克隆工具在近 30 種語言中進行對話,而無需先輸入文字。
實現語言無障礙的夢想
ElevenLabs 的 CEO 和共同創始人 Mati Staniszewski 在一份宣告中表示:“ElevenLabs 的創立是希望讓所有內容在任何語言和聲音中都可以普遍被使用。”他表示:“透過這次的推出,我們更接近實現這個夢想,讓人類品質的人工智慧聲音在各種方言中都可以使用。我們的文字到語音生成工具有助於平等競爭,為所有創作者帶來高品質的語音能力。”
引起正反兩種聲音的爭議
ElevenLabs 近幾個月來在輿論上引起了一些正面和負面的關注。該平臺在一月底推出測試版之後,很快就受到了廣泛關注,這要歸功於其生成的語音質量高和慷慨的免費使用者特權。然而正如之前所提到的,宣傳並不總是積極的,特別是當壞分子利用該平臺來進行惡意活動時。聞名的 4chan 討論區利用 ElevenLabs 的工具分享模仿著名人物如演員艾瑪·沃森的仇恨言論。此外《The Verge》的詹姆斯·文森特也能夠使用 ElevenLabs 克隆目標人物的聲音,在幾秒鐘內生成包含威脅暴力和種族歧視言論的音訊樣本。對此 ElevenLabs 表示將引入一系列新的防護措施,如將語音克隆約束在付費帳戶中,並提供新的人工智慧檢測工具。
挑戰配音行業
ElevenLabs 還必須面對其平臺和其他類似平臺對配音行業的威脅。Motherboard 曾報導過配音演員越來越多地被要求放棄對他們聲音的版權,以便客戶可以使用人工智慧生成合成版本,最終可能取代他們。此外《紐約時報》看到的內部郵件顯示,世界上最大的遊戲發行商之一 Activision Blizzard 正在開發 AI 輔助的“語音克隆”工具。ElevenLabs 似乎將這視為事物的自然進展,並宣稱其與 Storytel 等發行商合作的專案取得了成功。ElevenLabs 的計劃是將 AI 模型擴充套件到配音領域,並在像 Papercup 和 Deepdub 這樣的新創公司的基礎上建立“從一種語言到另一種語言的情感和語調轉換的基礎”。此外 ElevenLabs 還計劃引入能夠讓使用者分享語音的機制,不過細節尚不清楚。
延伸閱讀
- Garena 暗中開發以印度為主題的遊戲,Free Fire 的重新上線仍存疑
- 頭條新聞:頂級公司專頁功能即將上線,搭載 AI 及行銷工具助您擴充套件觀眾量
- Deepgram 推出 Aura:賦予 AI 代理人聲音
- 《Fortnite 今年將重返 iOS,但僅在歐洲上線》
- 蘋果新推出的「日記」應用程式現已隨 iOS 17.2 更新上線
- 蘋果推出的日記 App 上線了 - 讓我們來看看它的優點和缺點
- AI 深偽技術悔改者的告白: 揭開使用 ElevenLabs 複製 Jill Biden 聲音的真相
- 聽覺觸控:視障者透過聲音看見世界
- 蘋果手錶的最佳新功能現已上線
- Web3 專案「Memeland」由 9GAG 團隊打造,剛上線幾分鐘後就成功籌集到 1000 萬美元!