市場觀察

Voice.ai 募得 600 萬美元,因其即時音效轉換器的使用者數近 50 萬,吸引眾多使用者

Voice.ai 募得 600 萬美元,旗下即時音效轉換器使用者數已接近 50 萬近幾個月,Midjourney 和 ChatGPT 等服務推動了人工智慧在基本文字提示下建立影象和文字的邊界。現在聲音似乎是不可避免的下一個領域。近期,音樂生成、語言學習的 AI 導師以及語音模擬器等技術均有所發展。V .... (往下繼續閱讀)

分享到 Facebook 分享到 Line 分享到 Twitter

文章目錄

Voice.ai 募得 600 萬美元,因其即時音效轉換器的使用者數近 50 萬,吸引眾多使用者

Voice.ai 募得 600 萬美元,旗下即時音效轉換器使用者數已接近 50 萬

近幾個月,Midjourney 和 ChatGPT 等服務推動了人工智慧在基本文字提示下建立影象和文字的邊界。現在聲音似乎是不可避免的下一個領域。近期,音樂生成、語言學習的 AI 導師以及語音模擬器等技術均有所發展。Voice.ai 希望以實時音效轉換技術加入這一對話中,而現在該公司在早期增長後成功獲得了首輪外部資金。憑藉超過 48 萬使用者和超過 5 萬個音效濾鏡庫,Voice.ai 獲得了 600 萬美元的資金,並計劃將其音效轉換技術應用到新領域。Mucker Capital 和 M13 是這一輪的領投公司。在此之前,Voice.ai 靠口耳相傳發展起來,其 Discord 頻道已經有超過 12 萬人。此前,Voice.ai 透過 300 萬美元的自我資金支援其發展。當前,公司的工具可作為 Mac、PC、Android 和 iOS 的應用程式使用,且已在 TikTok、Zoom、Discord、Minecraft、GTA5、Fortnite、Valorant、League of Legends、Among Us、Skype、Whatsapp 等平臺上被遊戲玩家、創作者、虛擬博主等採用。Voice.ai 的介面可以讓使用者建立新聲音,或從遍布 50,000 種不同的預設聲音中進行選擇(由其他使用者建立並共享),這些聲音可以原樣使用或進行修改,並可以在支援的平臺上進行實時使用或錄製。

技術發展和增長計劃

公司計劃使用募資資金聘請更多技術人才,並開發與 Meta、Unreal 和 Unity 等其他平臺合作的新的軟體開發工具包(SDK)和應用程式介面(API),增加多語言支援以及新增像歌唱這樣以聲音為核心的新應用。該新創公司沒有明確提及,但值得關注的是,它是否還會利用部分募資資金增加伺服器容量。這不是一個小的負擔。根據經驗教訓,我們得知當前許多人工智慧應用的規模化問題中,GPU 瓶頸是最大的約束因素之一。這也是為什麼你會看到涉及策略性提供處理和伺服器容量的大型交易正在進行。

對於 Voice.ai 特別來說使用者的聲音在本地處理,透過創始人兼執行長 Heath Ahrens 所描述的“虛擬音訊電纜”輸送到它將被使用的地方。但當你檢視其應用的評論時,一個普遍的抱怨是,當你註冊時,由於“高度需求使我們的伺服器達到最大容量”,你被放在候補名單上,並承諾在伺服器容量提高時將通知你。當今市場上已經有數十家語音轉換和語音合成服務提供商,其中已經有很多活動:去年 Spotify 收購了 Sonantic,Snap 早在此之前就收購了一家 AI 語音助理公司;另一家新創公司 Sanas 正在努力改變使用者的口音,還有 Murf 和 Acapela 等語音模擬器等。Voice.ai 將自己歸類為 Respeecher 和 ElevenLabs 兩家語音轉換新創公司的一部分,這兩家新創公司讓使用者可以應用遮罩來調整或完全改變他們的聲音,有時甚至可以建立完全合成的聲音來取代真實的聲音。Respeecher 成立於烏克蘭並總部設在那裡,曾以為新的《星際大戰》系列電影建立達斯·維達的聲音,該聲音基於詹姆斯·厄爾·瓊斯 45 年前首次詮釋該角色時的聲音。ElevenLabs 則以令人生畏的聲音克隆平臺而聞名(或者可以說是臭名昭著),本月初,該公司從一群大型投資者那裡籌得了 1900 萬美元的最新融資。

Voice.ai 試圖在這一混合中定位自己作為 Everyman 的 AI 聲音修改應用程式。Ahrens 在一封給 TechCrunch 的郵件中說:“有很多公司正在試圖向企業提供不同風格的聲音技術。”他有一些在建立 B2B AI 技術方面的經驗:他的兩家前公司——文字轉語音的 iSpeech 和人臉識別的 Haystack——都是基於 API 的。他說:“Voice.ai 的獨特之處在於,我們致力於將以前僅針對企業的技術直接帶給消費者,並以負擔得起的方式提供。”許多使用者,他指出來自於他們過去使用過的經典的數位訊號處理音效修改器,這些音效修改器在許多遊戲玩家和流媒體主之間仍然非常流行。

當前大多數使用者使用的是免費服務,他們需要選擇在計算裝置上提供計算能力來訓練 Voice.ai 的模型。Voice.ai 的服務是建立在其自有的由“數百萬獨特使用者”組成的資料集上的。網站上沒有提供價格訊息,我們正在尋求相關詳細訊息。Ahrens 補充道:“我們相信使技術可及,並打算與開源社區合作,以實現聲音 AI 技術的民主化。” Voice.ai 還聲稱採用了根本不同的方法來改變聲音,並借鑒了 Vtuber、遊戲玩家和其他網路使用者使用頭像時所形成的一些觀念。“大多數進入這個領域的語音 AI 公司都試圖建立可擴充套件的面向企業的文字到語音解決方案,或者昂貴的用於製作工作室的語音到語音服務。”Ahrens 說。“我們則從相反的範疇開始,努力為那些希望在網路上擴充套件自己聲音的人創造價值。我們的語音到語音 AI 的核心價值主張不是完美地復制任何給定的人。它保留使用者語音的核心元素:他們的情感、節奏和強調並透過替換聲音產生一個全新的結果,實時地。”

潛在使用者和投資者的期望

由於互動性平臺(如遊戲)的人口結構現狀,Voice.ai 的觀眾當前 70%是男性,30%是女性。使用該技術的人群不斷擴大,不僅包括使用虛擬形象並為其配音的人以及那些希望獲得更多隱私保護的人,還包括“可以用與其身份相符的聲音代表自己的跨性別者”等。已經有一部分使用者使用 Voice.ai 的直接消費者產品,但 Mucker Capital 投資該新創公司的原因之一是他們相信,有機會建立一個使用和整合 Voice.ai 技術的開發者社區。領頭投資方 Mucker Capital 的合夥人 Omar Hamoui 表示:“Voice.ai 將透過提供曾經只為大型企業提供的易於使用的解決方案,為開發者在全球範圍內提供平等的存取權。”(Hamoui 曾經創辦了移動廣告新創公司 Admob,最終被 Google 收購,因此他在構建移動開發工具方面有一些直接經驗。)M13 的前營運長 Karl Alomar 為 M13 領投方這次投資了該新創公司,並表示投資者將在發展的下一階段中發揮積極作用。他說:“在 Digital Ocean,我們也看到透過建立開發人員社區的價值,這正是由開發者共同建設。我們期待創作者和開發者在 Voice.ai 平臺上進行構建。”

Technology-Voice.ai,即時音效轉換器,使用者數,募資,600 萬美元
江塵

江塵

Reporter

大家好!我是江塵,一名熱愛科技的發展和創新,我一直都保持著濃厚的興趣和追求。在這個瞬息萬變的數位時代,科技已經深入到我們生活的方方面面,影響著我們的工作、學習和娛樂方式。因此,我希望透過我的部落格,與大家分享最新的科技資訊、趨勢和創新應用。