AIGC

OpenAI 讓 ChatGPT 實現口語對話的聲音功能

OpenAI 為 ChatGPT 新增口語對話的功能作者：保羅·索沃斯（Paul Sawers） | 發布時間：8 小時前 OpenAI 宣布，ChatGPT 不再只是一個基於文字的搜尋引擎，它正在為其新增新的聲音和影象功能。這款獲得極高關注的生成式人工智慧助理自從九個月前問世以來，一直是近期技術領域 .... (往下繼續閱讀)

by 江塵
2023/9/25
5 分鐘閱讀時間

A- A A+

文章目錄

OpenAI 為 ChatGPT 新增口語對話的功能

作者：保羅·索沃斯（Paul Sawers） | 發布時間：8 小時前

OpenAI 宣布，ChatGPT 不再只是一個基於文字的搜尋引擎，它正在為其新增新的聲音和影象功能。這款獲得極高關注的生成式人工智慧助理自從九個月前問世以來，一直是近期技術領域最大的成功故事之一，它能夠根據簡單的文字提示生成論文、詩歌和摘要。但現在 ChatGPT 將變得更加互動，使用者還可以透過聲音和聊天機器人進行對話。

今年同一天，亞馬遜承諾向 OpenAI 的競爭對手 Anthropic 投資最高 40 億美元，這是科技巨頭之間在生成式人工智慧領域爆發的一場大型戰爭的一部分。包括 Google 試圖透過其智慧機器人 Bard 追趕，Meta 採取堅定的開源理念以取得競爭優勢以及微軟與 OpenAI 緊密合作等等。

對話啟動器

今天OpenAI 將語音助手的熟悉世界與其強大的大型語言模型（LLM）相結合，這對生成式人工智慧領域來說是一個值得注意的進化。例如，使用者可以口頭要求 ChatGPT 即時編寫一個睡前故事，只需幾句話的提示即可引導情節發展。使用者也可以直接問一個問題，ChatGPT 將以口語形式作出回答。

ChatGPT 的使用者還可以使用影象進行搜尋，例如上傳一張圖片並請 ChatGPT 解釋其中包含的內容，或者提供實現某個目標的指導。

![ChatGPT 影象搜尋功能](https://example.com/image.jpg)

語音功能是由一種可以根據文字生成類似人聲的新的文字到語音模型提供支援，OpenAI 表示與專業配音演員合作創造了五種不同的語音，使用了其開源的 Whisper 語音識別系統將口語發音轉錄為文字。匹配合作夥伴 Spotify 還推出了一個很棒的新功能，允許播客主人錄製自己的聲音，並將節目從英語翻譯為西班牙語、法語或德語，同時維持其原聲。

然而 OpenAI 似乎很謹慎，不希望吸引批評，因此這項技術尚不對所有人開放。它專門與包括戴克斯·謝帕德、莫妮卡·帕德曼、萊克斯·弗裏德曼、比爾·西蒙斯和史蒂芬·巴特萊特在內的播客主人合作推出。

OpenAI 在一篇博文中寫道：“這種能夠根據僅僅幾秒鐘真實語音生成逼真合成聲音的新技術，可以為多種創意和可存取性應用開啟嶄新的大門。” “然而這些功能也帶來了新的風險，例如惡意操作者冒充公眾人物或從事欺詐活動。”

這些新功能將在接下來的兩周內開始逐步提供給付費的 Plus 和 Enterprise 訂閱者使用。使用者需要前往應用程式的“設定”選單，然後進入“新功能”並選擇加入語音對話。然後，他們需要點選右上角的耳機按鈕，並選擇所需的語音。語音功能最初將以測試版本的方式在 ChatGPT 的 Android 和 iOS 應用中提供，而影象搜尋功能將在所有平臺上預設啟用。

關鍵詞：OpenAI ChatGPT 口語對話 聲音功能

OpenAI|ChatGPT|口語|對話|聲音|功能-wordpress,OpenAI,ChatGPT,口語對話,聲音功能

市場觀察

AIGC

Web 3

專案故事

網路議題

產品管理

專案管理

閱讀心得

職涯觀點

日常生活

專案工具

資料收集

OpenAI 讓 ChatGPT 實現口語對話的聲音功能

文章目錄

OpenAI 為 ChatGPT 新增口語對話的功能

作者：保羅·索沃斯（Paul Sawers） | 發布時間：8 小時前

對話啟動器

延伸閱讀

亞馬遜以 40 億美元對抗 ChatGPT 和 Google Bard，期許 Anthropic's Claude 成為聊天機器人最強之選

ChatGPT 攜手聲音和圖片上傳，開啟多模態新時代

江塵