網路議題

「打破語言障礙:ElevenLabs 推出多語言文字轉語音,服務多元觀眾」

ElevenLabs 推出多國語言版本的文字轉語音工具結束測試階段,進入正式商業運營 ElevenLabs 是一家成立僅一年的新創公司,利用機器學習技術進行語音複製和合成。今天該公司宣布擴充套件其平臺,推出支援 30 種語言的新文字轉語音模型。這次擴充套件標誌著該平臺正式退出測試階段,可供企業和個人 .... (往下繼續閱讀)

分享到 Facebook 分享到 Line 分享到 Twitter

文章目錄

「打破語言障礙:ElevenLabs 推出多語言文字轉語音,服務多元觀眾」

ElevenLabs 推出多國語言版本的文字轉語音工具

結束測試階段,進入正式商業運營

ElevenLabs 是一家成立僅一年的新創公司,利用機器學習技術進行語音複製和合成。今天該公司宣布擴充套件其平臺,推出支援 30 種語言的新文字轉語音模型。這次擴充套件標誌著該平臺正式退出測試階段,可供企業和個人使用,以定制他們的內容,以迎合全球觀眾。此前,ElevenLabs 以近 1 億美元的估值,進行了一輪 1900 萬美元的 A 輪融資。該公司的執行長兼聯合創始人 Mati Staniszewski 在一份宣告中表示:“ElevenLabs 的創立初衷是使所有內容在任何語言和語音中普遍可用。隨著 Eleven 多語言 v2 的發布,我們距離實現這一夢想又近了一步,能夠在每種方言中提供人類品質的人工智慧語音。”他補充道:“最終我們希望透過人工智慧涵蓋更多的語言和語音,消除內容的語言障礙。”

功能與應用

ElevenLabs 提供了兩個主要的以語音為焦點的人工智慧產品——語音合成和語音實驗室。前者是一個從文字輸入生成自然聲音的合成工具。後者可以使使用者克隆自己的聲音,或者透過隨機抽樣語音引數生成全新的合成語音,用於語音合成工具。使用者可以建立自定義語音後,將其插入文字轉語音工具中,將自己選擇的任何短文或長文內容轉換為自己偏好的語音,毫不費力。作為替代方案,他們也可以使用該公司提供的一系列預製人工智慧語音,或者由社區建立並公開共享的語音。在早期版本中,該合成工具僅支援英語合成語音。稍後,ElevenLabs 推出了多語言版本 1,使用文字輸入和人工智慧語音生成六種語言的語音,包括英語、波蘭語、德語、西班牙語、法語、義大利語、葡萄牙語和印地語。現在隨著 Eleven 多語言版本 2 的推出,這個產品現在可以在 30 多種語言中合成語音。這包括韓語、荷蘭語、土耳其語、瑞典語、印尼語、越南語、菲律賓語、烏克蘭語、希臘語、捷克語、芬蘭語、羅馬尼亞語、丹麥語、保加利亞語、馬來語、匈牙利語、挪威語、斯洛伐克語、克羅埃西亞語、傳統阿拉伯語和泰米爾語。這一舉措實際上意味著一個人可以克隆自己的語音,並使用它來在不同市場上用不同語言產生語音。根據 ElevenLabs 的說法,使用者只需用他們選擇的語言輸入文字,選擇他們想要的聲音(預製、合成或克隆),調整一些語音引數。模型將自動識別所輸入文字的語言,並使用設定的引數在該語言中生成語音。它還可以在所有語言中保持所選聲音的獨特特徵,包括其原始口音。Staniszewski 告訴 VentureBeat 說:“我們的模型能夠理解詞語之間的關係,並根據上下文調整交付方式(上下文化的文字轉語音)。因為模型中沒有硬編碼的語音特徵,它可以在建立人工智慧語音時健壯地預測成千上萬個語音特徵。這意味著 ElevenLabs 的模型可以考慮每個生成發話的周圍文字,以保持適當的語句流暢,而不是分別生成每個發話,這可能會產生聽起來機器人化的語音。”

文字轉語音工具的廣泛應用

自從該平臺推出測試版本以來,ElevenLabs 就受到了企業和創作者的關注,聲稱在全球註冊了超過一百萬使用者。最新的推出預計不僅會增加平臺的使用者基數,還會增加平臺每天生成的內容量。Staniszewski 解釋說:“我們有一些企業客戶在使用我們的產品,他們的應用案例各不相同:從為影片遊戲中的角色提供聲音,到為客戶服務虛擬形象提供聲音,再到為視障人士錄製有聲書以及生成其他形式的內容。”最近,該公司與 ArXiv 合作,為所有論文提供附加的音訊版本,以增加可用性。它還與 Storytel 合作,增加有聲書的選擇,提供除人類旁白之外的其他人工智慧語音。在未來的某個時候,該公司的執行長預計它還可以使多語言電影配音完全無縫,同時保留原始演員的口音和情感。

未來發展

作為實現這一使命的一部分,ElevenLabs 計劃透過增加更多的語言和功能來擴充套件其產品,包括一個專案工具,可以讓使用者更容易結構化和編輯長文內容。根據 Staniszewski 的說法,它將為從長篇內容生成語音提供“Google 檔案”級的簡單性。“到今年年底,我們還計劃推出我們的人工智慧配音工具的測試版本,該工具將使使用者能夠立即將一種語言的語音轉換為另一種語言,同時保留原始演講者的聲音。”他指出。在這個以人工智慧為動力的語音合成領域,ElevenLabs 與 MURF.AI、Play.ht 和 WellSaid Labs 等公司競爭。Market US 的資料顯示,這類工具的全球市場在 2022 年達到了 12 億美元,預計到 2032 年將接近 50 億美元,年均複合增長率略高於 15.40%。

評論與建議

打破語言障礙,實現多元觀眾

ElevenLabs文字轉語音工具的多國語言版本的推出,將有助於打破語言障礙,實現多元觀眾。隨著全球化的進一步推進,越來越多的企業和內容創作者希望將他們的內容本地化,以吸引不同國家和地區的觀眾。ElevenLabs 的新工具提供的多語言合成語音,使得這一目標變得更加容易實現。使用者可以根據自己的需求克隆自己的聲音或使用其他人工智慧語音,將內容轉換為多種語言,以迎合不同市場的需求。這無疑為企業和內容創作者提供了一個更有效的方式來進入全球市場,增加他們的目標觀眾。

技術進步帶來的倫理問題

然而隨著文字轉語音技術的不斷進步,我們也需要關注其中潛在的倫理問題。例如,這種技術可能被濫用,用於製作虛假的語音訊息,從而威脅到語音識別和個人訊息安全。此外語音合成工具也可能被用於假造的音訊證據,從而影響司法審判和刑事調查的公正性。因此在推廣和應用這項技術的過程中,我們需要加固相關法律法規的制定和執行,以確保這項技術的利用不會對個人權益和社會安全產生威脅。

不斷發展的人工智慧技術

ElevenLabs 不僅在文字轉語音領域取得了巨大的突破,還計劃引入更多的語言和功能,擴大其產品線。隨著人工智慧技術的不斷發展,我們可以預見,這項技術將在更多的應用場景中發揮作用。例如,人工智慧語音合成技術可以應用於音訊書籍、影片遊戲、教育輔助工具等領域,為使用者提供更好的體驗和便利。然而同時我們也需要認識到這些技術的局限性和風險,並制定相應的監管措施,確保它們的運用符合倫理原則和社會價值。

結論

ElevenLabs 推出的多國語言版本的文字轉語音工具為企業和內容創作者提供了一個強大的工具,幫助他們打破語言障礙,實現多元觀眾。隨著人工智慧技術的不斷發展,這種工具的應用前景非常廣闊。然而同時我們也需要關注其中的倫理問題,並制定相應的監管措施,以確保這項技術的利用是合法、安全和符合社會利益的。
Multilingual-wordpress,語言障礙,多語言,文字轉語音,ElevenLabs,多元觀眾
江塵

江塵

Reporter

大家好!我是江塵,一名熱愛科技的發展和創新,我一直都保持著濃厚的興趣和追求。在這個瞬息萬變的數位時代,科技已經深入到我們生活的方方面面,影響著我們的工作、學習和娛樂方式。因此,我希望透過我的部落格,與大家分享最新的科技資訊、趨勢和創新應用。