
人工智慧的聲音佔據了網路
作者:David Pierce
專欄編輯兼 The Vergecast 聯合主持人
2023 年 9 月 11 日,UTC 時間 13:47 | 轉載本文分享
愛不愛聽聲音純屬個人喜好,但你可能沒想過,在網際網路上你幾乎時時刻刻都聽到人工智慧生成的聲音。當你與 Alexa 或 Siri 對話時,他們背後的模型是透過人類語音訓練而能夠說出幾乎任何事情。你有沒有在 Waze 上聽到名人給你指路?其實也是人工智慧。每當你在 TikTok 上看影片並聽到微微愉快的聲音朗讀字幕,那也是完全由人工智慧生成的。甚至,蘋果的人工智慧系統也能在你睡前為你朗讀一本浪漫小說。人工智慧系統在將文字轉化為可信的語音上已經變得非常出色,幾乎能夠操縱任何語言和任何聲音。
在 The Vergecast 的這一集節目中,第一部分講的就是人工智慧,而剛好我就是該節目的聲音代表。我們透過使用我的聲音訓練了一些不同的人工智慧機器人——有時是讀著一些無意義的句子指令碼,有時是上傳了一些舊的 Vergecast 片段的音訊,或者兩者兼而有之——來看看我們能有多快、多好地製作出我聲音的可以過關的人工智慧副本。相當令人驚訝。以下就是節目:
如果你想快速比較一下不同的工具,首先是從出色的 Dwight Schrute 參考講話開始:
我們將這段文字轉錄下來,放入我們測試的每一個人工智慧生成器中。以下是 Podcastle 用人工智慧生成的聲音代表 David Pierce 的聲音:
同樣的內容,Descript 的人工智慧生成結果如下:
iOS 17 中的全新個人語音功能:
最後 ElevenLabs 是我們測試的工具中最逼真、最令人印象深刻的:
我覺得最終任何一個人工智慧聲音都不會取代我。但是它們的表現越來越好,速度也越來越快,這引發了許多重大的可能性和重大的問題。我能創造出如此逼真的副本,而且它們只會隨著時間的推移變得更好、更容易操作,這意味著什麼?作為製造者,我有什麼責任?其他人有什麼責任?我們現在在 AI 音樂方面正在進行大量的辯論,顯然,藝術家的聲音被用來訓練模型,這些模型能夠以任何人的聲音演唱出非常令人信服的歌曲。這將引發十年的有趣訴訟和倫理辯論,但同樣的事情也會發生在你和我身上。我們如何使用這些工具?我們如何談論它們?我們是否能夠在不引發深度偽造和問題的同時從中獲得好處、幫助和民主化的東西?我們有很多事情需要弄清楚,而且時間不等人。因為現在的技術真的很好,而且它正在進步得非常快。
評論
大多數受歡迎的迪士尼電影都已被製作成非常昂貴的 100 片藍光光碟集合
Dynamic Island 原來不是什麼令人興奮的旅遊目的地——但這沒關係
我絕不希望與我家的咖啡機分開
你很快就能夠購買一部全新的 Xbox 360
如何使用 Google Photos 的新網頁編輯工具
廣告贊助商內容
關鍵字: 技術 or 通訊-人工智慧聲音、網際網路、大眾、共處