網路議題

Meta 推出一個能夠轉錄並翻譯接近 100 種語言的 AI 模型

AI 模型能翻譯和轉錄近 100 種語言 AI 技術公司 Meta 近日推出了一款名為 SeamlessM4T 的 AI 模型,能夠翻譯和轉錄近 100 種語言的文字和語音。這一成果在 AI 語音轉文字和語音翻譯領域被視為一次“重大突破”。該模型使用開源平臺,並與一個新的翻譯資料集 SeamlessA .... (往下繼續閱讀)

分享到 Facebook 分享到 Line 分享到 Twitter

文章目錄

Meta 推出一個能夠轉錄並翻譯接近 100 種語言的 AI 模型

AI 模型能翻譯轉錄近 100 種語言

AI 技術公司 Meta 近日推出了一款名為 SeamlessM4T 的 AI 模型,能夠翻譯轉錄近 100 種語言的文字和語音。這一成果在 AI 語音轉文字和語音翻譯領域被視為一次“重大突破”。該模型使用開源平臺,並與一個新的翻譯資料集 SeamlessAlign 一同提供。Meta 在一篇發給 TechCrunch 的部落格文章中寫道:“我們的單一模型能夠提供即時翻譯,使使用不同語言的人們能夠更有效地交流。SeamlessM4T 能隱式識別源語言,無需使用獨立的語言識別模型。”

AI 翻譯技術的布局與挑戰

Meta 並不是唯一一家在開發 AI 翻譯轉錄工具方面投入資源的公司。除了 Amazon、Microsoft、OpenAI 等商業服務和開源模型提供商之外,Google 正在開發宇宙語音模型(Universal Speech Model),旨在打造一個能理解全球最多種語言的模型。Mozilla 則推動了 Common Voice 計劃,該計劃是整合多種語言的語音資料集,用於訓練自動語音識別算法。SeamlessM4T 在將翻譯轉錄能力結合到一個模型中的努力可以說是迄今為止最有野心的專案。

資料爬取與模型不完美之處

Meta 聲稱它獲取的資料(包括來自網路上的文字和語音)並不具有版權,大部分來自開源和有許可證的來源。然而該方法引起了一些資源提供方的爭議,他們認為企業應該給予貢獻並提供退選選項。除此之外,Meta 還指出 SeamlessM4T 在翻譯中存在偏見,比如在某些語言中,詞彙轉譯出現了負面和不尊重的情況。Meta 強調這個模型並不會生成過多的有毒文字,但仍不完美。

AI 翻譯的局限性和建議

AI 翻譯工具存在語義結構的損失,例如過度依賴準確性可能導致文字多樣性和豐富性的減少。因此 Meta 建議不要在長篇翻譯和法律翻譯等需要認證的情景中使用 SeamlessM4T。此外 Meta 也不建議將 SeamlessM4T 應用於醫療和法律領域,以防發生錯譯。此外針對 AI 翻譯之前出現的一些問題,比如誤判引起的執法錯誤,我們期望在未來的發展中人類也能參與其中以確保資訊的準確性和及時性問題。

結論

SeamlessM4T 的出現在 AI 翻譯轉錄領域具有重要意義。然而我們必須關注 AI 翻譯工具帶來的偏見和不完美性。這需要業界努力改進和完善,並與更多有影響力的組織合作,以確保 AI 技術的發展在符合道德和社會價值觀的前提下進行。同時我們應該識別 AI 翻譯工具的局限性,並謹慎應用,特別是在有關法律和醫療等領域。AI 翻譯工具只是輔助人類溝通的工具,人類的智慧和專業知識仍然是不可或缺的。

Translation-wordpress,AI 模型,翻譯,轉錄,Meta,語言,技術,自動化,機器學習,自然語言
江塵

江塵

Reporter

大家好!我是江塵,一名熱愛科技的發展和創新,我一直都保持著濃厚的興趣和追求。在這個瞬息萬變的數位時代,科技已經深入到我們生活的方方面面,影響著我們的工作、學習和娛樂方式。因此,我希望透過我的部落格,與大家分享最新的科技資訊、趨勢和創新應用。