
ElevenLabs 的語音生成工具正式推出
ElevenLabs 推出正式版語音生成工具,支援超過 30 種語言
ElevenLabs 是一個利用人工智慧技術建立合成音訊的平臺,今天正式推出了它的語音生成工具。該公司表示借助內部開發的新人工智慧模型,其工具現在能夠自動識別包括韓語、荷蘭語和越南語在內的超過 30 種語言,並以這些語言生成“情感豐富”的語音。在新模型的加持下,ElevenLabs 的客戶可以利用該平臺的語音克隆工具在近 30 種語言中進行對話,而無需先輸入文字。
實現語言無障礙的夢想
ElevenLabs 的 CEO 和共同創始人 Mati Staniszewski 在一份宣告中表示:“ElevenLabs 的創立是希望讓所有內容在任何語言和聲音中都可以普遍被使用。”他表示:“透過這次的推出,我們更接近實現這個夢想,讓人類品質的人工智慧聲音在各種方言中都可以使用。我們的文字到語音生成工具有助於平等競爭,為所有創作者帶來高品質的語音能力。”
引起正反兩種聲音的爭議
ElevenLabs 近幾個月來在輿論上引起了一些正面和負面的關注。該平臺在一月底推出測試版之後,很快就受到了廣泛關注,這要歸功於其生成的語音質量高和慷慨的免費使用者特權。然而正如之前所提到的,宣傳並不總是積極的,特別是當壞分子利用該平臺來進行惡意活動時。聞名的 4chan 討論區利用 ElevenLabs 的工具分享模仿著名人物如演員艾瑪·沃森的仇恨言論。此外《The Verge》的詹姆斯·文森特也能夠使用 ElevenLabs 克隆目標人物的聲音,在幾秒鐘內生成包含威脅暴力和種族歧視言論的音訊樣本。對此 ElevenLabs 表示將引入一系列新的防護措施,如將語音克隆約束在付費帳戶中,並提供新的人工智慧檢測工具。
挑戰配音行業
ElevenLabs 還必須面對其平臺和其他類似平臺對配音行業的威脅。Motherboard 曾報導過配音演員越來越多地被要求放棄對他們聲音的版權,以便客戶可以使用人工智慧生成合成版本,最終可能取代他們。此外《紐約時報》看到的內部郵件顯示,世界上最大的遊戲發行商之一 Activision Blizzard 正在開發 AI 輔助的“語音克隆”工具。ElevenLabs 似乎將這視為事物的自然進展,並宣稱其與 Storytel 等發行商合作的專案取得了成功。ElevenLabs 的計劃是將 AI 模型擴充套件到配音領域,並在像 Papercup 和 Deepdub 這樣的新創公司的基礎上建立“從一種語言到另一種語言的情感和語調轉換的基礎”。此外 ElevenLabs 還計劃引入能夠讓使用者分享語音的機制,不過細節尚不清楚。
延伸閱讀
- ElevenLabs 推出全新語音轉文字模型,引領 AI 語音技術的新潮流!
- 「AI 音訊新星 ElevenLabs 獲 1.8 億美元 C 輪融資,估值高達 33 億美元!」
- 「X 宣布全新影像生成器 Aurora 將於本週正式上線,期待不已!」
- 投資人熱衷進攻:ElevenLabs 有望逼近 30 億美元估值!
- 社群網紅購物應用 LTK 新功能上線,自動私訊工具助力購物攻略
- Pocket FM 攜手 ElevenLabs,快速將劇本轉化為音訊內容
- ElevenLabs 推出 AI 動力工具,生成音效
- OpenAI 宣布移除 ChatGPT 的像 Scarlett Johansson 一樣的聲音
- Garena 暗中開發以印度為主題的遊戲,Free Fire 的重新上線仍存疑
- 頭條新聞:頂級公司專頁功能即將上線,搭載 AI 及行銷工具助您擴充套件觀眾量