AI 技術與晶片進步，助力語音辨識大躍進

AI 技術與晶片進步提升語音辨識 IBM 與加州大學的研究有望改善語音癱瘓和失語症患者的情況近日 IBM 和加州大學舊金山分校以及加州大學伯克利分校的研究團隊都宣布了對語音辨識技術的重要進展，這對於患有語音癱瘓和失語症的患者來說是一個很好的訊息。在語音領域的大規模模型應用快速增長的情況下，人們注意到硬 .... (往下繼續閱讀)

by 江塵
2023/8/28
9 分鐘閱讀時間

A- A A+

文章目錄

AI 技術與晶片進步，助力語音辨識大躍進

AI 技術與晶片進步提升語音辨識

IBM 與加州大學的研究有望改善語音癱瘓和失語症患者的情況
近日 IBM 和加州大學舊金山分校以及加州大學伯克利分校的研究團隊都宣布了對語音辨識技術的重要進展，這對於患有語音癱瘓和失語症的患者來說是一個很好的訊息。在語音領域的大規模模型應用快速增長的情況下，人們注意到硬體效能的約束導致了訓練時間的延長和能源消耗的急劇增加。麻省理工學院科技評論最近報導，訓練一個單一的 AI 模型所產生的二氧化碳排放超過 626,000 磅，幾乎是一輛普通美國汽車終身所排放的五倍。AI 操作背後巨大能量消耗的一個重要因素是資料在記憶體和處理器之間的來回傳輸。IBM 的研究人員正在尋求解決方案，他們的原型機將相變儲存器裝置整合到晶片中，最佳化了稱為多累加（MAC）操作的基本 AI 過程，從而大大加快了晶片的運算速度，並且避免了資料在記憶體和處理器之間來回傳輸時的時間和能源消耗。IBM 的 Stefano Ambrogia 在 8 月 23 日發表在《自然》期刊的一篇研究中表示：“據我們所知，這是商業可行的模型的第一次顯示出明顯的準確性水平。”這個原型機在處理器密集的語音辨識操作中，每瓦特每秒達到 12.4 兆次運算，效率比當前最強大的 CPU 和 GPU 高出數百倍。
與此同時加州大學舊金山分校和加州大學伯克利分校的研究團隊表示他們開發了一種大腦-電腦介面技術，可以讓失去說話能力的人透過思維和口語努力生成單詞。加州大學舊金山分校的神經外科學主席 Edward Chang 表示：“我們的目標是恢復一種完整的、身體化的交流方式，這是我們與他人談話的最自然方式。”Chang 和他的團隊在一名患有肌萎縮性脊髓側索硬化症（ALS）的女性的大腦表面植入了兩個微小的感測器。ALS 是一種逐步剝奪患者行動能力和語音能力的神經退行性疾病。雖然這名患者仍然能發出聲音，但 ALS 使她的嘴脣、舌頭和喉嚨受限，無法講出連貫的話語。這些感測器透過大腦-電腦介面存取到安裝有語言解碼軟體的電腦群組上。在接受了 25 個每次持續四小時的訓練之後，這位女性朗讀了 260 到 480 個句子。在她朗讀的過程中，解碼器轉化了她的腦部活動，檢測到了音素並將其組合成單詞。研究人員根據她多年前在婚禮上的講話錄音綜合了她的語音，並設計了反映她面部運動的虛擬人物。結果令人鼓舞，經過四個月的訓練，這一模型能夠跟蹤患者嘗試的發音，並將其轉化為可理解的單詞。當訓練詞彙量為 125,000 個單詞時，準確性達到 76%。當詞彙量約束為 50 個單詞時，翻譯系統的表現更好，成功識別她的語音的時間達到 90%。此外這一系統能夠以每分鐘 62 個單詞的速度翻譯患者的語音。儘管比之前類似實驗的詞語識別速率提高了三倍，但研究人員意識到還需要進一步改進，才能達到自然語言每分鐘 160 個詞的速度。這篇研究於 8 月 23 日發表在《自然》期刊上，共同作者 Frank Willett 表示：“這只是一個科學概念的證實，還不是人們可以在日常生活中使用的實際裝置。但這是恢復癱瘓患者的快速交流的一個重大進步。”

AI 技術與語音辨識的未來展望
這些最新的進展為 AI 技術和語音辨識帶來了重大突破，對於患有語音癱瘓和失語症的人們來說是一個重要的利好訊息。AI 技術的快速發展為我們提供了更多的可能性，不僅能夠使許多日常任務自動化，還能夠幫助那些失去說話能力的人重新獲得表達自己的能力。沒有言語的人往往感到無助和孤立，而這些新的技術有望改變他們的生活。
然而儘管這些新技術帶來了希望，但我們仍然需要以謹慎的態度對待。首先這些技術還處於實驗階段，距離實際應用還有一段路要走。現在的研究僅僅是成功證實了這些理念的可行性，而實際應用需要面對更多的挑戰，例如適應各種說話方式和語言背景，實現更高速率的翻譯和更好的準確性等等。此外這些技術還需要透過法律和倫理的考量，確保患者的隱私和安全。

AI 技術和倫理的關係
隨著 AI 技術的發展，倫理問題也越來越受到關注。在語音辨識技術中，人們也需要關注患者的個人隱私和使用這些技術所需的知情同意。AI 技術所涉及的資料搜集和分析以及對個人訊息的使用都需要受到嚴格的管控，以確保個人隱私的保護。
此外 AI 技術的發展也引發了對於人工智慧對人類的替代和社會影響的關注。儘管 AI 技術可以幫助人們更好地生活和工作，但也存在著一些潛在風險和挑戰。例如，技術的過度依賴可能會導致人們失去一些重要技能或工作機會，同時也可能對社會造成不平等和不公正。因此倫理問題應該成為 AI 技術發展的重要議題，需要建立相關的規範和監管機制，以確保技術的健康發展和社會的良性執行。

總結和建議
AI 技術的進步和語音辨識的突破為語音癱瘓和失語症患者帶來了新的希望和可能性。IB 之的晶片技術和加州大學的大腦-電腦介面技術為我們展示了在這一領域取得重大進展的可能性。然而我們需要保持謹慎和冷靜的態度，對這些技術進行更多的研究和評估，以確保它們的可靠性和可持續性。同時我們也需要關注技術發展中的倫理問題，確保文明社會的價值觀和道德標準在 AI 技術的應用中得到充分尊重和保護。
對於患有語音癱瘓和失語症的人們來說這些新技術無疑是一個重要的突破。他們可以透過這些技術重新獲得表達自己的能力，並與他人進行更好的交流。然而我們仍然需要關注技術的可用性和可負擔性，以確保更多的人能夠受益於這些技術。
此外我們也應該鼓勵更多的研究和創新，以推動這些技術的發展。政府、學術界和產業界應該加固合作，提供更多的資金和資源，支援這一領域的研究和應用。同時也應該加固對公眾的教育，提高他們對這些新技術的認識和理解，以減少對技術的不必要擔憂和恐懼，從而更好地推動技術的應用和發展。
總之 AI 技術的發展和語音辨識的突破為我們帶來了新的機遇和挑戰。我們應該以謹慎和冷靜的態度面對這些技術，同時也應該加固倫理意識和社會責任，確保技術的可持續發展和對社會的積極貢獻。

Technology-AI 技術,晶片進步,語音辨識,大躍進

延伸閱讀

WhatsApp 即將讓你分享原始品質的圖片和影片

Google Flights 現在會告訴你最便宜的訂票時間

江塵

Reporter

大家好！我是江塵，一名熱愛科技的發展和創新，我一直都保持著濃厚的興趣和追求。在這個瞬息萬變的數位時代，科技已經深入到我們生活的方方面面，影響著我們的工作、學習和娛樂方式。因此，我希望透過我的部落格，與大家分享最新的科技資訊、趨勢和創新應用。