網路議題

AI 聲音正佔領網際網路？大眾的聲音如何與之共處？

人工智慧的聲音佔據了網路作者：David Pierce 專欄編輯兼 The Vergecast 聯合主持人 2023 年 9 月 11 日，UTC 時間 13:47 | 轉載本文分享愛不愛聽聲音純屬個人喜好，但你可能沒想過，在網際網路上你幾乎時時刻刻都聽到人工智慧生成的聲音。當你與 Alexa 或 Si .... (往下繼續閱讀)

by 程宇肖
2023/9/11
6 分鐘閱讀時間

A- A A+

文章目錄

人工智慧的聲音佔據了網路

作者：David Pierce

專欄編輯兼 The Vergecast 聯合主持人

2023 年 9 月 11 日，UTC 時間 13:47 | 轉載本文分享

愛不愛聽聲音純屬個人喜好，但你可能沒想過，在網際網路上你幾乎時時刻刻都聽到人工智慧生成的聲音。當你與 Alexa 或 Siri 對話時，他們背後的模型是透過人類語音訓練而能夠說出幾乎任何事情。你有沒有在 Waze 上聽到名人給你指路？其實也是人工智慧。每當你在 TikTok 上看影片並聽到微微愉快的聲音朗讀字幕，那也是完全由人工智慧生成的。甚至，蘋果的人工智慧系統也能在你睡前為你朗讀一本浪漫小說。人工智慧系統在將文字轉化為可信的語音上已經變得非常出色，幾乎能夠操縱任何語言和任何聲音。

在 The Vergecast 的這一集節目中，第一部分講的就是人工智慧，而剛好我就是該節目的聲音代表。我們透過使用我的聲音訓練了一些不同的人工智慧機器人——有時是讀著一些無意義的句子指令碼，有時是上傳了一些舊的 Vergecast 片段的音訊，或者兩者兼而有之——來看看我們能有多快、多好地製作出我聲音的可以過關的人工智慧副本。相當令人驚訝。以下就是節目：

如果你想快速比較一下不同的工具，首先是從出色的 Dwight Schrute 參考講話開始：

我們將這段文字轉錄下來，放入我們測試的每一個人工智慧生成器中。以下是 Podcastle 用人工智慧生成的聲音代表 David Pierce 的聲音：

同樣的內容，Descript 的人工智慧生成結果如下：

iOS 17 中的全新個人語音功能：

最後 ElevenLabs 是我們測試的工具中最逼真、最令人印象深刻的：

我覺得最終任何一個人工智慧聲音都不會取代我。但是它們的表現越來越好，速度也越來越快，這引發了許多重大的可能性和重大的問題。我能創造出如此逼真的副本，而且它們只會隨著時間的推移變得更好、更容易操作，這意味著什麼？作為製造者，我有什麼責任？其他人有什麼責任？我們現在在 AI 音樂方面正在進行大量的辯論，顯然，藝術家的聲音被用來訓練模型，這些模型能夠以任何人的聲音演唱出非常令人信服的歌曲。這將引發十年的有趣訴訟和倫理辯論，但同樣的事情也會發生在你和我身上。我們如何使用這些工具？我們如何談論它們？我們是否能夠在不引發深度偽造和問題的同時從中獲得好處、幫助和民主化的東西？我們有很多事情需要弄清楚，而且時間不等人。因為現在的技術真的很好，而且它正在進步得非常快。

評論

大多數受歡迎的迪士尼電影都已被製作成非常昂貴的 100 片藍光光碟集合

Dynamic Island 原來不是什麼令人興奮的旅遊目的地——但這沒關係

我絕不希望與我家的咖啡機分開

你很快就能夠購買一部全新的 Xbox 360

如何使用 Google Photos 的新網頁編輯工具

廣告贊助商內容

關鍵字: 技術 or 通訊-人工智慧聲音、網際網路、大眾、共處

TechnologyorCommunication-AI 聲音,網際網路,大眾,共處

市場觀察

AIGC

Web 3

專案故事

網路議題

產品管理

專案管理

閱讀心得

職涯觀點

日常生活

專案工具

資料收集

AI 聲音正佔領網際網路？大眾的聲音如何與之共處？

文章目錄

人工智慧的聲音佔據了網路

延伸閱讀

蘋果手錶 Ultra 究竟適合誰？

Nvidia 與英特爾上的 Starfield 表現「奇怪糟糕」，Digital Foundry 報導

程宇肖