Google 的新 Gemini 模型可以分析長達一小時的影片,但很少人能使用它
介紹
Google 最新的 GenAI 模型 Gemini 1.5 Pro 被設計用於處理大量資料,能夠處理 700,000 字或 30,000 行程式碼以及長達 11 小時的音訊或一小時的影片,這是 Gemini 1.0 Pro 的 35 倍。儘管這項技術被譽為突破,但實際使用者卻極為有限,僅有獲得 Google 批準的開發者和一些 Google Vertex AI 平臺的客戶才能使用。哲學討論
長時間的上下文對於 GenAI 模型的發展至關重要,因為它能夠幫助模型更好地理解資料的敘事流程,從而生成更多上下文豐富的回應。儘管有其他公司也進行有關上下文視窗的實驗,但 Google 是第一家商業化推出這麼大上下文視窗的模型,該模型在商業價值和應用前景上具有重要意義。編輯觀點
Gemini 1.5 Pro 雖然帶來了擴充套件的上下文視窗,但當前的延遲時間可能會讓許多使用者感到不滿。隨著技術的最佳化,這樣的延遲可能會得到改善,但對於一些應用情境,這種延遲依然是一個值得關注的問題。 此外 Google 對於 Gemini 1.5 Pro 的價格設定尚未公開,這也是使用者關心的焦點之一。Gemini Ultra 等其他模型的升級是否與 Pro 模型同步,也是一個有待關注的問題。建議
對於開發者和科技公司來說 Gemini 1.5 Pro 帶來的大上下文視窗對於處理大量資料、分析影片等應用具有巨大潛力。然而對於普通使用者和企業來說現有的延遲問題可能會約束其應用範圍。在使用 Gemini 1.5 Pro 時,應該根據具體應用情境來評估其是否值得投入。 建議 Google 將更多關注放在最佳化模型的延遲問題上,並透過開放的溝通與使用者分享更多關於價格和未來發展的訊息,以滿足使用者對於產品的期待和信任。ArtificialIntelligence-Google,Gemini 模型,影片分析,使用約束
延伸閱讀
- OpenAI 與 Google 擺出競爭的 AI 願景
- Netflix 將建立自己的廣告伺服器挑戰 Google 和 Amazon
- Google 仍未修復 Gemini 偏見影像生成器
- Google 在 Android 上新增實時威脅檢測和螢幕分享保護
- Google 掃描通話的人工智慧或增加預設審查,隱私專家發出警告
- Google 推出新的 Private Space 功能,就像是 Android 版的無痕模式
- Google I/O 2024:Google 剛宣布的所有重大訊息
- Google 發布 AI 動態威脅檢測服務,打擊 Android 惡意軟體
- Google 將在桌面版 Chrome 中加入其 Gemini Nano AI 模型
- Google 宣布 Patreon 和 Grammarly 已開始測試 Gemini Nano