亞馬遜升級 Alexa,追趕生成式 AI 的腳步
引言
亞馬遜近日宣布將為其旗艦語音助手 Alexa 引進新的自定義生成式語言模型(LLM)。這項升級將使 Alexa 擁有更強大的能力和更貼近人類對話的特性。亞馬遜公司的高級副總裁兼裝置與服務部門負責人大衛·林普在亞馬遜華盛頓特區 HQ2 總部的盛大活動上宣布了這一訊息。根據亞馬遜科學領域的高級副總裁暨首席科學家羅希特·普拉薩德的說法,這項訊息標誌著我們所喜愛的助手將會進行一次“巨大的轉變”。
追趕生成式 AI 的腳步
亞馬遜進入對話型生成式語言模型領域的時間雖然比 OpenAI 的 ChatGPT 晚了近一年,但該公司聲稱這款新的 Alexa LLM 是值得等待的。亞馬遜表示與 ChatGPT 不同,Alexa LLM 提供“實時訊息”,在對話中具有更高的互動性、更低的延遲。在活動中,亞馬遜還特別提到了 ChatGPT,稱其 Alexa LLM“超越了瀏覽器或手機上的 ChatGPT”,人們可以使用 Alexa LLM 進行“真實世界應用”,例如關於食譜、旅行建議和撰寫詩歌等。
普拉薩德表示:“我們的 LLM 之所以與眾不同,不僅會告訴你訊息,它還會執行操作。”為了證實這一理念,林普在與媒體記者和亞馬遜員工的面前進行了現場展示,詢問自己“最喜歡的足球隊”的動態,而 Alexa 則記得他指的是範德堡大學,展示了其個性化功能。如果使用者最喜歡的隊伍贏了比賽,Alexa 也會以“喜悅”的聲音回應。林普還要求 Alexa 給他的朋友寫一封訊息,提醒他們看即將到來的範德堡大學足球比賽,幾秒鐘內助手就完成了這一操作。亞馬遜還播放了一段宣傳影片,暗示新的 Alexa LLM 將成為使用者的“家庭一員”。
四大元件和第三方應用
普拉薩德表示新的 Alexa LLM 圍繞著四個主要元件進行構建:大型語言模型、真實世界的裝置和服務、個人上下文和負責任的人工智慧。事實上亞馬遜的副總裁 Heather Zorn 還表示開發人員可以將自己的“定制”第三方生成式語言模型整合到 Alexa 中。一家名為 Character.AI 的新創公司已經這樣做了,該公司允許使用者建立並與不同的虛構角色進行互動,提供了 25 種不同的個性型別。另一家名為 Splash 的開發者提供了將其應用程式與 Alexa 整合,使使用者能夠建立和預覽歌曲的功能。
技術上的升級
普拉薩德表示 Alexa 的文字轉語音引擎現在對情感和語調更具上下文感知性,並在輸出中表現出與說話者的語調相似的情感變化。它還包括一個新的自動語音識別系統,專為對話而設計,“繼承了最佳元素並進一步提升”,並且使用了一個巨大的“轉換器模型”。對於內建螢幕和攝像頭的 Amazon Echo Show 裝置,只需對著裝置看一眼,已經登記了視覺 ID 的亞馬遜使用者便可以輕鬆與 Alexa 進行對話,不再需要反覆說“Alexa”。他們可以像與其他人對話一樣與助手交談。這要歸功於“裝置內的視覺處理和聲學模型的協同工作,以便它知道你是在對 Alexa 說話還是在對房間中的其他人說話”,普拉薩德解釋道。
觀點與建議
亞馬遜為 Alexa 引入新的生成式語言模型,顯示了亞馬遜對人工智慧的持續投入和創新。在這個日益數位化的時代,語音助手成為了與人工智慧互動的重要入口。但是我們也必須提醒自己,這些助手僅僅是機器,並不能真正理解和模擬人類的思維和情感。無論 Alexa LLM 有多麼貼近人類對話,我們也應該保持對技術的冷靜分析,並不盲目地依賴它們。
同時開發者將自己的生成式語言模型整合到 Alexa 中,開啟了無限可能。這將為使用者提供更加個性化的體驗和多樣化的功能。然而開發者也應該對於模型的設計和使用負起責任,確保它們不僅僅是好玩的工具,而且符合倫理和隱私等基本原則。
作為消費者,我們可以期待 Alexa LLM 的更多功能和更自然的對話。然而在享受其便利的同時我們也應該保持警惕和審慎,明智地使用這些技術,並確保我們的個人資料和隱私得到保護。
延伸閱讀
- 亞馬遜推出 Bedrock Studio:簡化生成式人工智慧應用開發
- 在非洲,亞馬遜終於扎根電商
- 為什麼 RAG 無法解決生成式 AI 的幻覺問題
- 亞馬遜旗下的 Audible 將利用 Prime Video 資料進行有聲書推薦,與 Spotify 競爭加劇
- 亞馬遜旗下的 Audible 將測試使用 Prime Video 資料進行有聲書推薦
- 亞馬遜 CodeWhisperer 更名為 Q Developer 並擴大功能
- 英國調查亞馬遜和微軟與 Mistral、Anthropic 和 Inflection 的 AI 合作關係
- 亞馬遜計劃託管企業定製的生成式人工智慧模型
- 亞馬遜在美國推出全新的雜貨送貨訂閱服務
- 亞馬遜停止加州無人機送貨服務