
OpenAI 為 ChatGPT 新增口語對話的功能
作者:保羅·索沃斯(Paul Sawers) | 發布時間:8 小時前
OpenAI 宣布,ChatGPT 不再只是一個基於文字的搜尋引擎,它正在為其新增新的聲音和影象功能。這款獲得極高關注的生成式人工智慧助理自從九個月前問世以來,一直是近期技術領域最大的成功故事之一,它能夠根據簡單的文字提示生成論文、詩歌和摘要。但現在 ChatGPT 將變得更加互動,使用者還可以透過聲音和聊天機器人進行對話。
今年同一天,亞馬遜承諾向 OpenAI 的競爭對手 Anthropic 投資最高 40 億美元,這是科技巨頭之間在生成式人工智慧領域爆發的一場大型戰爭的一部分。包括 Google 試圖透過其智慧機器人 Bard 追趕,Meta 採取堅定的開源理念以取得競爭優勢以及微軟與 OpenAI 緊密合作等等。
對話啟動器
今天OpenAI 將語音助手的熟悉世界與其強大的大型語言模型(LLM)相結合,這對生成式人工智慧領域來說是一個值得注意的進化。例如,使用者可以口頭要求 ChatGPT 即時編寫一個睡前故事,只需幾句話的提示即可引導情節發展。使用者也可以直接問一個問題,ChatGPT 將以口語形式作出回答。
ChatGPT 的使用者還可以使用影象進行搜尋,例如上傳一張圖片並請 ChatGPT 解釋其中包含的內容,或者提供實現某個目標的指導。

語音功能是由一種可以根據文字生成類似人聲的新的文字到語音模型提供支援,OpenAI 表示與專業配音演員合作創造了五種不同的語音,使用了其開源的 Whisper 語音識別系統將口語發音轉錄為文字。匹配合作夥伴 Spotify 還推出了一個很棒的新功能,允許播客主人錄製自己的聲音,並將節目從英語翻譯為西班牙語、法語或德語,同時維持其原聲。
然而 OpenAI 似乎很謹慎,不希望吸引批評,因此這項技術尚不對所有人開放。它專門與包括戴克斯·謝帕德、莫妮卡·帕德曼、萊克斯·弗裏德曼、比爾·西蒙斯和史蒂芬·巴特萊特在內的播客主人合作推出。
OpenAI 在一篇博文中寫道:“這種能夠根據僅僅幾秒鐘真實語音生成逼真合成聲音的新技術,可以為多種創意和可存取性應用開啟嶄新的大門。” “然而這些功能也帶來了新的風險,例如惡意操作者冒充公眾人物或從事欺詐活動。”
這些新功能將在接下來的兩周內開始逐步提供給付費的 Plus 和 Enterprise 訂閱者使用。使用者需要前往應用程式的“設定”選單,然後進入“新功能”並選擇加入語音對話。然後,他們需要點選右上角的耳機按鈕,並選擇所需的語音。語音功能最初將以測試版本的方式在 ChatGPT 的 Android 和 iOS 應用中提供,而影象搜尋功能將在所有平臺上預設啟用。
關鍵詞:OpenAI ChatGPT 口語對話 聲音功能
延伸閱讀
- OpenAI 的創意寫作 AI 讓人想起高中文學社那個討人厭的孩子
- 微軟加速 AI 研發程式,直指 OpenAI 競爭對手
- 一年過去了,OpenAI 的聲音複製工具仍未問世!
- OpenAI 重磅推出 GPT-4.5:歷史上最大的語言模型來了!
- OpenAI 計劃將 Sora 影片生成器整合至 ChatGPT,開啟創意新視界!
- OpenAI 的創業帝國:揭密其風投基金背後的諸多創新公司
- 揭開 Mistral AI 的神祕面紗:揭示 OpenAI 競爭者的所有祕密!
- 「深入解析!ChatGPT 收費全攻略:你需要知道的一切」
- 「OpenAI 為付費 ChatGPT 使用者推出深度研究功能,探索智慧對話的新境界!」
- 《OpenAI 為何尚未將深度研究成果引入其 API?背後原因大揭密!》