
視障者的新希望:透過音訊視覺化技術讓聲音幫助看見
背景
澳洲科技大學(University of Technology Sydney)的研究團隊與悉尼大學(University of Sydney)及新創企業 ARIA Research 共同合作,研發出一項名為「音訊視覺化(acoustic touch)」的尖端技術,幫助視障者透過聲音來「看見」事物。根據世界衛生組織(World Health Organization)的統計,全球約有 3,900 萬人失明,還有 2.46 億人視力不佳,這影響了他們參與日常生活活動的能力。
音訊視覺化技術的工作原理
一般的智慧眼鏡通常使用計算機視覺和其他感知訊息將佩戴者周圍的場景轉化為計算機合成的語音。然而音訊視覺化技術則是透過聲音的方式對物體進行聲音表徵,當物體進入裝置的視野時,會創造出獨特的聲音呈現。例如,搖曳的樹葉的聲音可能代表一棵植物,而嗡嗡聲可能代表一部手機。
研究成果與效果
澳洲科技大學的 Zhu 博士領導的一項研究在 journal PLOS ONE 上進行了發表,研究了音訊視覺化技術對視障者的功效和可用性。研究團隊對 14 名參與者進行了測試:7 名視覺障礙或低視力的參與者和 7 名蒙眼的視力常規的參與者作為對照組。他們發現,配備了音訊視覺化技術的可穿戴裝置顯著提高了視障者識別和伸手觸控物體的能力,並且不會過多地消耗他們的心智努力。
Zhu 博士表示:"聽覺反饋使使用者能夠以驚人的準確度識別和伸手觸控物體。我們的研究結果表明,音訊視覺化具有成為視覺障礙社區的可穿戴和有效的感知擴充方法的潛力。"
展望與建議
此項研究強調開發輔助技術的重要性,使視障者能夠克服定位特定家居物品和個人物品等日常挑戰。透過解決這些日常挑戰,音訊視覺化技術為視障者開啟了新的大門,增強了他們的獨立性和生活品質。隨著不斷的改進,音訊視覺化技術可能成為輔助技術的一部分,比以往更高效、更有效地幫助人們更好地使用環境。
然而我們應該意識到技術本身並非唯一的解決方案。除了科技創新之外,我們還需要不斷努力來改善社會環境和推動包容性,以使視覺障礙者能夠在各個領域中充分參與和發揮他們的潛能。這需要政府、教育機構和社會組織的共同努力。
在應用音訊視覺化技術的同時我們也應該保障個人隱私和資料安全。隨著技術的進展,個人資料的收集和使用將變得越來越普遍。我們需要建立適當的法律和監管框架,確保這些資料在被使用和儲存的過程中得到充分的保護。
結論
音訊視覺化技術為視障者帶來了新的希望,幫助他們透過聲音來感知周圍的世界。這項尖端技術的潛力是巨大的,可以在視覺輔助技術領域產生深遠的影響。然而我們應該在技術發展的同時同樣重視社會環境的改善和包容性,確保每個人都能夠平等地參與社會和享受生活。
延伸閱讀
- OpenAI 宣布移除 ChatGPT 的像 Scarlett Johansson 一樣的聲音
- Deepgram 推出 Aura:賦予 AI 代理人聲音
- 蘋果 Vision Pro 現破天荒支援分屏功能
- 為世界帶來喜悅之時 | 迪恩·高橋的 GamesBeat Next 演講
- 位元組跳動的新 AI SALMONN 可以理解所有音訊,不僅僅是音樂和聲音
- Par Equity VC 公司瞄準北部英國新創公司,籌集 1 億英鎊,倫敦不再是唯一聲音
- AI 帶回已故《電馭叛客 2077》演員的聲音,為《幻影自由》重獲新生
- 新聞網站主編:如何因應升息世界的創業企業生存指南
- Spotify 將克隆播客主持人的聲音 - 跨語言翻譯讓聆聽更方便
- Spotify 計畫複製有線廣播主的聲音並翻譯至其他語言