Google 的新 Gemini 模型可以分析長達一小時的影片,但很少人能使用它
介紹
Google 最新的 GenAI 模型 Gemini 1.5 Pro 被設計用於處理大量資料,能夠處理 700,000 字或 30,000 行程式碼以及長達 11 小時的音訊或一小時的影片,這是 Gemini 1.0 Pro 的 35 倍。儘管這項技術被譽為突破,但實際使用者卻極為有限,僅有獲得 Google 批準的開發者和一些 Google Vertex AI 平臺的客戶才能使用。哲學討論
長時間的上下文對於 GenAI 模型的發展至關重要,因為它能夠幫助模型更好地理解資料的敘事流程,從而生成更多上下文豐富的回應。儘管有其他公司也進行有關上下文視窗的實驗,但 Google 是第一家商業化推出這麼大上下文視窗的模型,該模型在商業價值和應用前景上具有重要意義。編輯觀點
Gemini 1.5 Pro 雖然帶來了擴充套件的上下文視窗,但當前的延遲時間可能會讓許多使用者感到不滿。隨著技術的最佳化,這樣的延遲可能會得到改善,但對於一些應用情境,這種延遲依然是一個值得關注的問題。 此外 Google 對於 Gemini 1.5 Pro 的價格設定尚未公開,這也是使用者關心的焦點之一。Gemini Ultra 等其他模型的升級是否與 Pro 模型同步,也是一個有待關注的問題。建議
對於開發者和科技公司來說 Gemini 1.5 Pro 帶來的大上下文視窗對於處理大量資料、分析影片等應用具有巨大潛力。然而對於普通使用者和企業來說現有的延遲問題可能會約束其應用範圍。在使用 Gemini 1.5 Pro 時,應該根據具體應用情境來評估其是否值得投入。 建議 Google 將更多關注放在最佳化模型的延遲問題上,並透過開放的溝通與使用者分享更多關於價格和未來發展的訊息,以滿足使用者對於產品的期待和信任。ArtificialIntelligence-Google,Gemini 模型,影片分析,使用約束
延伸閱讀
- Google 為 Android 打造了一些最早期的社交應用程式,包括 Twitter 和其他應用
- Google 為 iPhone 使用者帶來「圈選搜尋」新變化
- Google 錢包正式登陸印度市場
- Google 新推出預算款 Pixel 8a,更新硬體配置,售價 499 美元
- Google 稱 Epic 在反壟斷訴訟勝訴後的要求「不必要」和「超出判決範圍」
- Google 擴大 Passkey 支援,提前爲美國總統大選加固保護計畫
- Google 裁員 Flutter、Dart 和 Python 團隊,開發者大會前數週 in traditional Chinese
- Google 裁員 Flutter、Dart 和 Python 工程師,開發者大會前夕訊息爆發
- Google 推出新功能“口語練習”,利用人工智慧幫助使用者提高英文能力
- Google 支援的 Glance 在美國試點推出 Android 鎖定屏平臺