網路議題

AI 聲音正佔領網際網路?大眾的聲音如何與之共處?

人工智慧的聲音佔據了網路作者:David Pierce 專欄編輯兼 The Vergecast 聯合主持人 2023 年 9 月 11 日,UTC 時間 13:47 | 轉載本文分享愛不愛聽聲音純屬個人喜好,但你可能沒想過,在網際網路上你幾乎時時刻刻都聽到人工智慧生成的聲音。當你與 Alexa 或 Si .... (往下繼續閱讀)

分享到 Facebook 分享到 Line 分享到 Twitter

文章目錄

AI 聲音正佔領網際網路?大眾的聲音如何與之共處?

人工智慧的聲音佔據了網路

作者:David Pierce

專欄編輯兼 The Vergecast 聯合主持人

2023 年 9 月 11 日,UTC 時間 13:47 | 轉載本文分享

愛不愛聽聲音純屬個人喜好,但你可能沒想過,在網際網路上你幾乎時時刻刻都聽到人工智慧生成的聲音。當你與 Alexa 或 Siri 對話時,他們背後的模型是透過人類語音訓練而能夠說出幾乎任何事情。你有沒有在 Waze 上聽到名人給你指路?其實也是人工智慧。每當你在 TikTok 上看影片並聽到微微愉快的聲音朗讀字幕,那也是完全由人工智慧生成的。甚至,蘋果的人工智慧系統也能在你睡前為你朗讀一本浪漫小說。人工智慧系統在將文字轉化為可信的語音上已經變得非常出色,幾乎能夠操縱任何語言和任何聲音。

在 The Vergecast 的這一集節目中,第一部分講的就是人工智慧,而剛好我就是該節目的聲音代表。我們透過使用我的聲音訓練了一些不同的人工智慧機器人——有時是讀著一些無意義的句子指令碼,有時是上傳了一些舊的 Vergecast 片段的音訊,或者兩者兼而有之——來看看我們能有多快、多好地製作出我聲音的可以過關的人工智慧副本。相當令人驚訝。以下就是節目:

如果你想快速比較一下不同的工具,首先是從出色的 Dwight Schrute 參考講話開始:

我們將這段文字轉錄下來,放入我們測試的每一個人工智慧生成器中。以下是 Podcastle 用人工智慧生成的聲音代表 David Pierce 的聲音:

同樣的內容,Descript 的人工智慧生成結果如下:

iOS 17 中的全新個人語音功能:

最後 ElevenLabs 是我們測試的工具中最逼真、最令人印象深刻的:

我覺得最終任何一個人工智慧聲音都不會取代我。但是它們的表現越來越好,速度也越來越快,這引發了許多重大的可能性和重大的問題。我能創造出如此逼真的副本,而且它們只會隨著時間的推移變得更好、更容易操作,這意味著什麼?作為製造者,我有什麼責任?其他人有什麼責任?我們現在在 AI 音樂方面正在進行大量的辯論,顯然,藝術家的聲音被用來訓練模型,這些模型能夠以任何人的聲音演唱出非常令人信服的歌曲。這將引發十年的有趣訴訟和倫理辯論,但同樣的事情也會發生在你和我身上。我們如何使用這些工具?我們如何談論它們?我們是否能夠在不引發深度偽造和問題的同時從中獲得好處、幫助和民主化的東西?我們有很多事情需要弄清楚,而且時間不等人。因為現在的技術真的很好,而且它正在進步得非常快。

評論

大多數受歡迎的迪士尼電影都已被製作成非常昂貴的 100 片藍光光碟集合

Dynamic Island 原來不是什麼令人興奮的旅遊目的地——但這沒關係

我絕不希望與我家的咖啡機分開

你很快就能夠購買一部全新的 Xbox 360

如何使用 Google Photos 的新網頁編輯工具

廣告贊助商內容

關鍵字: 技術 or 通訊-人工智慧聲音、網際網路大眾共處

TechnologyorCommunication-AI 聲音,網際網路,大眾,共處
程宇肖

程宇肖

Reporter

大家好!我是程宇肖,我對於科技的發展和應用有著濃厚的興趣,並致力於將最新的科技趨勢和創新帶給大家。科技領域的變化速度驚人,每天都有令人興奮的新發現和突破。作為一名部落格作者,我將帶領大家深入探索科技的奧秘和應用的無限可能。