市場觀察

聲音生成平臺 ElevenLabs 籌得 1900 萬美元,推出偵測工具

音訊生成平臺 ElevenLabs 籌得 1900 萬美元並推出偵測工具引言在最近的一輪融資中,具有病毒式爆發能力的人工智慧音訊生成平臺 ElevenLabs 籌得了全新的資金。該新創公司宣布完成了一輪 1,900 萬美元的 A 輪融資,由企業家 Nat Friedman、資深創業家 Daniel .... (往下繼續閱讀)

分享到 Facebook 分享到 Line 分享到 Twitter

文章目錄

聲音生成平臺 ElevenLabs 籌得 1900 萬美元,推出偵測工具

音訊生成平臺 ElevenLabs 籌得 1900 萬美元並推出偵測工具

引言

在最近的一輪融資中,具有病毒式爆發能力的人工智慧音訊生成平臺 ElevenLabs 籌得了全新的資金。該新創公司宣布完成了一輪 1,900 萬美元的 A 輪融資,由企業家 Nat Friedman、資深創業家 Daniel Gross 以及 Andreessen Horowitz 聯合領投。其他參與者包括 Creator Ventures、SV Angel、Instagram 聯合創始人 Mike Krieger、Oculus 聯合創辦人 Brendan Iribe、Deepmind 和 Inflection AI 聯合創辦人 Mustafa Suleyman 以及 O’Reilly Media 創辦人 Tim O’Reilly 等重量級投資者。 這筆融資將被用於繼續建設 ElevenLabs 的頂尖研究中心以及推出一系列支援特定市場垂直領域的產品,包括出版、遊戲、娛樂和對話應用等。ElevenLabs 的聯合創始人兼執行長 Mati Staniszewski 在接受 TechCrunch 電子郵件採訪時表示:“這筆投資將用於繼續建設 ElevenLab 的尖端研究中心,並推出一系列其他產品,以支援出版、遊戲、娛樂和對話應用等特定市場垂直領域。”至於公司的估值,根據知情人士透露,ElevenLabs 的市值在最新一輪融資後達到了 9900 萬美元。

ElevenLabs 的建立和技術

ElevenLabs 由曾在 Palantir 工作的 Staniszewski 和他的童年朋友、曾在 Google 工作的 Piotr Dabkowski 共同創辦。受到他們在波蘭長大時觀看的美國電影中翻譯質量低劣的啟發,他們設計了一個能夠更好地完成這項任務的平臺,當然是借助了人工智慧技術。ElevenLabs 可以使用合成音訊、複製音訊或完全新型的“人工”音訊將文字轉化為語音,這些音訊可以模仿不同性別、年齡和種族的人的聲音。該公司的 AI 文字到語音模型是語言不可知的,可以讓企業客戶對其進行微調,並在其之上構建自己的專有語音模型。 與 A 輪融資同時這家擁有 15 名員工的 ElevenLabs 推出了 Projects,一種用於編輯和建立長篇口述內容的工作流程。透過 Projects,使用者可以在不離開平臺的情況下生成對話片段,甚至可以製作有聲書籍。Staniszewski 表示:“對於商業合作夥伴,我們的技術可以應用於可擴充套件和多語言的有聲書籍創作、影片遊戲角色配音、數位文章配音、幫助視覺障礙者接觸線上文字內容以及推動 AI 廣播等領域。”

ElevenLabs 的資金和聲譽挑戰

ElevenLabs 在去年初推出測試版後迅速取得了成功,這主要歸功於其生成音訊的極高質量、快速的生成時間和慷慨的免費使用模式。但正如前面所提到的,這家新創公司不僅獲得了正面的關注,也遭遇了不少負面的評論。特別是當不良分子開始利用這個平臺為自己的目的而濫用時。ElevenLabs 提供了複製或從頭建立逼真音訊的工具,利用了人工智慧技術。臭名昭著的訊息板塊 4chan 使用 ElevenLabs 的工具分享激進內容,仿冒像演員艾瑪·沃森之類的名人的令人憎惡的訊息。此外《The Verge》的記者詹姆斯·文森特(James Vincent)能夠利用 ElevenLabs 在幾秒鐘內複製目標聲音,生成包含暴力威脅、種族主義和跨性別恐懼的音訊樣本。對此 ElevenLabs 表示將推出一系列新的安全措施,如約束聲音複製僅供付費使用者使用、封禁多次違反服務條款的使用者以及提供新的 AI 偵測工具。這款偵測工具已經於今天推出,名為 AI Speech Classifier,並作為 API 提供給“特選”合作夥伴使用,旨在檢測上傳的音訊樣本是否包含 ElevenLabs 的 AI 生成內容。 Staniszewski 表示:“確保生成式人工智慧平臺能夠安全運用是整個生成式媒體行業的一個重大挑戰,包括文字、影象和語音平臺。我們必須確保人們對生成式媒體的本質有所理解,並知道這些內容的存在。我們致力於建立工具,幫助人們檢測生成式人工智慧內容,以確保透明度。” 然而一個自願的檢測工具——即使其按照承諾常規執行——並不能必然阻止惡意行為。而且 ElevenLabs 還沒有解決的另一個問題是其技術對配音演員的存在威脅。Motherboard 曾報導配音演員越來越多地被要求放棄對其聲音的版權,使客戶能夠使用人工智慧生成合成版本,而無需對此進行額外補償。而根據《紐約時報》看到的內部電子郵件顯示,全球最大的遊戲發行商之一 Activision Blizzard 正在開發 AI 輔助的“聲音克隆”工具。ElevenLabs 似乎將這視為事情的自然發展,並宣傳其與 Storytel 等出版商和 TheSoul Publishing 及 MNTN 等媒體平臺在有聲書籍、影片遊戲和廣播內容方面的合作。(Storytel 和 TheSoul Publishing 是 ElevenLabs 的戰略投資者。)該公司聲稱在創意、娛樂和出版行業已經有超過一百萬註冊使用者,共建立了十年的音訊內容。ElevenLabs 計劃最終將其 AI 模型擴充套件到配音,追隨 Papercup 和 Deepdub 等新創公司的腳步,建立所謂的“轉移情感和語調從一種語言到另一種語言的基礎”。

結論

擁有 1900 萬美元的資金(其中 200 萬美元來自今年 1 月的種子輪融資),ElevenLabs 在快速增長的生成式音訊領域聚焦解決競爭對手問題。競爭對手包括 Amazon、Google 和 Microsoft 等老大們以及 Murf、Tavus、Resemble AI、Respeecher、Play.ht 和 Lovo 等新創公司。 就 ElevenLabs 的技術潛力和應用前景而言,該公司的音訊生成技術無疑是引人注目的。然而隨之而來的道德和聲譽挑戰也不容忽視。ElevenLabs 需要與相關利益相關方密切合作,共同解決這些問題。保護配音演員的權益和就業機會方面的關切需要得到重視,同時也需要制定更全面和堅固的機制,以防止平臺被濫用。在 AI 生成內容大行其道的時代,保護人們免受濫用和不當使用的影響變得尤為重要。 ElevenLabs 所作的投資也是對這一挑戰的回應,他們希望透過改進安全和偵測工具,提高透明度,幫助人們識別與 AI 生成內容相關的問題。保持公開、坦誠地討論這些問題,並將 AI 生成內容的潛在傷害納入公眾對話,能夠為整個行業提供更健康和可持續的發展前景。 Source: TechCrunch
音訊-ElevenLabs,聲音生成平臺,籌資,1900 萬美元,偵測工具
程宇肖

程宇肖

Reporter

大家好!我是程宇肖,我對於科技的發展和應用有著濃厚的興趣,並致力於將最新的科技趨勢和創新帶給大家。科技領域的變化速度驚人,每天都有令人興奮的新發現和突破。作為一名部落格作者,我將帶領大家深入探索科技的奧秘和應用的無限可能。