
研究人員開發 AI 工具改善聽障族群科技可及性
引言
聲控科技如 Alexa 和 Siri 雖然已相當普及,但由於缺乏對手語的支援,對於聽障人士或重聽障人士來說仍是很大的溝通障礙。為理解決這個問題,西班牙的巴塞隆納超級計算中心(BSC-CNS)和加泰隆尼亞理工大學(UPC)的研究人員開發了一個 AI 工具,希望能透過人工智慧技術打破這樣的障礙。
科技不平等的問題
科技是改變世界的力量,但如果我們的科技只有針對部分人群而非全體,那麼科技反而成了一種不平等的力量,甚至成了一個障礙。這樣科技可及性不足的問題已經被廣泛探討,然而在大眾聚焦於設計 UI/UX 以符合人類語言行為的同時對於非聲音語言的支援則似乎被忽略了。對於聽障族群來說科技可及性的問題顯然更為突出。而這個新的聽覺翻譯工具的出現將有助於改善這樣的問題。
對手語翻譯的技術
對手語的翻譯是一個複雜的問題,因為世界上有許多不同語言的手語,而這些手語也因地區文化不同而有所變化。BSC 與 UPC 的研究團隊透過結合計算機視覺、自然語言處理和機器學習技術,開發了一個基於 Transformer 模型的機器學習程式,能夠將整個手語句子轉換成語音文字。這個系統當前主要集中在美國手語(ASL)上,但只要所有必要的資料都可用,例如有一個包含手語句子(以影片格式)及其相對應口語翻譯(以文字格式)的平行資料庫,它也可以適應任何其他語言。
關注科技還需更多進展
這項研究是對改善聽障族群科技可及性的一大進步,但研究團隊強調當前的成果仍有待改進,並不足以推出具體應用程式提供給使用者。例如,這個程式當前僅能解讀美國手語,並需要更多相關資料庫資訊的支援。儘管如此開發出 AI 工具借以解決科技不平等的問題,已經開啟了更多可能性,未來我們可以期待這挑戰對於 AI 和科技巨頭而言,成為一件關注度極高的問題。
結論
我們期待像 BSC 和 UPC 這樣的研究團隊,能夠在全球範圍內推動更多如此具有貢獻價值的科技專案,解決不同群體對科技可及性的需求。同時也提醒廣大科技公司,該將目光放得更長遠,研究更具有包容性的科技,為所有人提供更好的科技體驗。
延伸閱讀
- OpenAI 的創意寫作 AI 讓人想起高中文學社那個討人厭的孩子
- 亞馬遜成立新型代理 AI 團隊,將如何改變科技未來?
- 「搶先報名!TechCrunch Sessions: AI 演講者申請截止日期迫在眉睫!」
- MWC 最新報導:AI 影響力的兩極化觀點首次曝光!
- 臺積電豪擲千億美金布局美國晶片產業!
- 全新藍天社交平臺 Flashes 正式上線,挑戰 Instagram 地位!
- 長壽專家彼得·阿提亞創立的新創公司終於揭開面紗!
- 「Inception 首度曝光!全新 AI 模型顛覆科技界!」
- 亞馬遜新推出 Alexa+:為孩子們帶來 AI 驅動的「探索」與「故事」新功能!
- Bridgetown Research 載著 AI 助力,成功募資 1900 萬美元加速盡職調查!