
新一代的文字轉語音 API
深度學習公司 Deepgram 一直以來都是語音識別領域的翹楚之一。今日,這家資金充沛的新創宣布推出了名為 Aura 的全新實時文字轉語音 API。Aura 將高度逼真的語音模型與低延遲的 API 相結合,使開發者能夠構建實時對話型人工智慧代理人。這些代理人可憑藉大型語言模型(LLMs)替代客服代理人,應用在呼叫中心及其他面向客戶的情境中。
卓越的技術與價格優勢
Deepgram 的共同創始人兼 CEO Scott Stephenson 表示獲取卓越的語音模型早已有之,但這些模型費用昂貴且運算時間長。另一方面,低延遲模型聽起來通常機械化。然而 Deepgram 的 Aura 則結合了極快的人類語音模型(通常不到半秒)且價格低廉。他指出:“現在每個人都需要實時語音人工智慧機器人,能感知說話內容、理解並生成回應,然後再進行語音回答。”對於這樣的服務,準確性、低延遲以及可接受的成本是必不可少的要素。Deepgram 主張,當前 Aura 的價格(每 1000 個字元 0.015 美元)幾乎擊敗了所有競爭對手。儘管與 Google WaveNet 的價格 0.016 美元相差不遠,Amazon Polly 的神經語音模型也是一樣,但 Deepgram 的價格更便宜。然而 Amazon 的最高級別則顯著昂貴。
技術重點與優勢
Aura 當前提供約十幾個語音模型,都是由 Deepgram 與聲音演員合作建立的資料集所訓練。與公司其他模型一樣,Aura 模型也是由公司內部訓練的。在速度方面,Aura 的反應生成時間極快(通常不到 0.3 秒),而語言模型完成生成回應的時間也很短(通常不到 1 秒)。
深度學習公司 Deepgram 獲得新資本,擴大企業語音識別業務
Deepgram 近期獲得新資金以擴大其企業語音識別業務。這些相關的關鍵字包括語音技術、Deepgram、Aura、AI 代理人、聲音、語音辨識、深度學習和人工智慧。
assistant
延伸閱讀
- 加州新 AI 法案出爐,SB 1047 作者再推出改革措施!
- 《超級瑪利歐成為 AI 基準測試的新標準!你絕對想不到的理由》
- Google 推出 SpeciesNet:專為識別野生動物而設的人工智慧模型!
- 安瑟普提克獲得 35 億美元巨額資金 瞄準人工智慧未來!
- OpenAI 重磅推出 GPT-4.5:歷史上最大的語言模型來了!
- 探索 DeepSeek:你必須理解的 AI 聊天機器人應用全指南!
- OpenAI 的創業帝國:揭密其風投基金背後的諸多創新公司
- 揭開 Mistral AI 的神祕面紗:揭示 OpenAI 競爭者的所有祕密!
- 未來科技:研究人員揭示如何打造變形機器人,猶如 T-1000 般神奇!
- ElevenLabs 推出全新語音轉文字模型,引領 AI 語音技術的新潮流!