網路議題

以人工智慧生成的語音為書籍注入個人化聲音

AI 生成的語音為書籍帶來個人化的聲音引言今年 9 月 20 日,來自微軟、麻省理工學院和古騰堡計劃(Project Gutenberg)的研究人員宣布了一項新舉措,將自然聽起來的 AI 生成的語音應用到從《After a Few Words》到《Zut and Other Parisians》等各 .... (往下繼續閱讀)

分享到 Facebook 分享到 Line 分享到 Twitter

文章目錄

以人工智慧生成的語音為書籍注入個人化聲音

AI 生成的語音為書籍帶來個人化的聲音

引言

今年 9 月 20 日,來自微軟、麻省理工學院和古騰堡計劃(Project Gutenberg)的研究人員宣布了一項新舉措,將自然聽起來的 AI 生成的語音應用到從《After a Few Words》到《Zut and Other Parisians》等各種書籍中。自動化有聲書製作並不是一個新概念,它已經存在多年。但是這項名為《Large-Scale Automatic Audiobook Creation》的 arXiv 預印版詳細介紹了一種新方法,該方法利用最新一代的神經文字到語音處理技術,在語音合成方面帶來了新的真實感和節省了時間和成本。

過去和現在的有聲書

當前的公有領域有聲書在很大程度上因為機械化的敘述聲音而缺乏動人的表現。然而這種新方法將生成具有獨特情感細微區別的敘述聲音。微軟的軟體工程師 Brendan Walsh 表示:“我們使用一套自動講者和情感推理系統根據上下文動態地改變閱讀的聲音和語調。”在故事中,敘述部分使用一種聲音朗讀,而角色的對白則使用不同的語音。語音的語調和風格取決於神經推理系統。“這使得多個角色和情感對話的段落更加逼真和吸引人。” Walsh 說道。此外顧客可以根據個人喜好調整聲音、音高、速度和語調。

個人化有聲書的未來潛力

研究人員表示他們正在準備一個現場展示,讓公眾能夠使用自己的聲音生成有聲書。只需要他們的一小段語音樣本,就可以生成一本完整的有聲書。去年四月,《華爾街日報》(The Wall Street Journal)報導了 DeepZen 有限公司(DeepZen Ltd.)使用已故演員 Edward Hermann 的聲音樣本來為數十本最近的有聲書進行配音的情況。有趣的是,Hermann 先生已經逝世將近十年了,但是由於生成式人工智慧技術,他的聲音樣本被用來準確地構造出一段自然的對話,包括自然的語調,幾乎和這位已故演員的實際聲音錄音難以識別。古騰堡計劃已經線上上公布了約 5000 本書籍,總計 35000 小時的語音內容。任何人都可以登入並收聽,而且這個服務是免費的。他們還將很快提供使用者錄製自己書籍的選項。使用者可以透過朗讀幾個句子來完成音訊概要檔案(voice profile)。古騰堡計劃將建立一個 AI 生成的語音,使用者可以立即收聽。使用者可以用自己的聲音朗讀前言或獻辭,然後上傳完整的書籍文字。完成後,使用者將收到一封包含有聲書連結的電子郵件。

當前和潛在的應用

不久的將來,當媽媽必須加班無法給七歲兒子讀一個晚安故事時,他只需要開啟自己最喜歡的有聲書,就能聽到媽媽安慰人心的聲音,為他講述冒險故事。此外有抱負的演員可以透過取樣自己在莎士比亞劇中扮演不同角色的聲音,為朋友快速製作禮物,使角色以自己的聲音活生生地浮現眼前。而且如果有合法的合作,誰不想選擇從泰勒·斯威夫特(Taylor Swift)、阿諾德·施瓦辛格(Arnold Schwarzenegger)或摩根·弗裏曼(Morgan Freeman)中選擇自己的小說的旁白?這對書籍、有聲書和大眾的互動有著巨大的潛力。

結論

在這個 AI 驅動的世界中,聲音的個人化經歷正在為書籍帶來一個全新的章節。透過 AI 生成的語音技術,有聲書成為一種更具真實感和情感的媒介,並提供了更加生動和貼近讀者的體驗。從父母給孩子講故事,到演員為角色賦予生命以及選擇名人旁白來注音自己的作品,這項技術的應用潛力令人興奮。然而我們也需對其進行深入的倫理和法律考量。在使用 AI 生成的語音時,私人隱私和版權問題是需要認真對待的議題。因此應加固法律法規、倫理規範和監管措施,以確保個人和社會的權益得到保護。同時也需要更多關於這項技術的研究和討論,以應對可能出現的挑戰和風險。然而無論如何,AI 生成的語音為書籍開啟了一扇全新的大門,為讀者提供了更加豐富和個人化的閱讀體驗。
Voice-人工智慧,語音生成,書籍,個人化聲音
江塵

江塵

Reporter

大家好!我是江塵,一名熱愛科技的發展和創新,我一直都保持著濃厚的興趣和追求。在這個瞬息萬變的數位時代,科技已經深入到我們生活的方方面面,影響著我們的工作、學習和娛樂方式。因此,我希望透過我的部落格,與大家分享最新的科技資訊、趨勢和創新應用。