
Google 的新 Gemini 模型可以分析長達一小時的影片,但很少人能使用它
介紹
Google 最新的 GenAI 模型 Gemini 1.5 Pro 被設計用於處理大量資料,能夠處理 700,000 字或 30,000 行程式碼以及長達 11 小時的音訊或一小時的影片,這是 Gemini 1.0 Pro 的 35 倍。儘管這項技術被譽為突破,但實際使用者卻極為有限,僅有獲得 Google 批準的開發者和一些 Google Vertex AI 平臺的客戶才能使用。
哲學討論
長時間的上下文對於 GenAI 模型的發展至關重要,因為它能夠幫助模型更好地理解資料的敘事流程,從而生成更多上下文豐富的回應。儘管有其他公司也進行有關上下文視窗的實驗,但 Google 是第一家商業化推出這麼大上下文視窗的模型,該模型在商業價值和應用前景上具有重要意義。
編輯觀點
Gemini 1.5 Pro 雖然帶來了擴充套件的上下文視窗,但當前的延遲時間可能會讓許多使用者感到不滿。隨著技術的最佳化,這樣的延遲可能會得到改善,但對於一些應用情境,這種延遲依然是一個值得關注的問題。
此外 Google 對於 Gemini 1.5 Pro 的價格設定尚未公開,這也是使用者關心的焦點之一。Gemini Ultra 等其他模型的升級是否與 Pro 模型同步,也是一個有待關注的問題。
建議
對於開發者和科技公司來說 Gemini 1.5 Pro 帶來的大上下文視窗對於處理大量資料、分析影片等應用具有巨大潛力。然而對於普通使用者和企業來說現有的延遲問題可能會約束其應用範圍。在使用 Gemini 1.5 Pro 時,應該根據具體應用情境來評估其是否值得投入。
建議 Google 將更多關注放在最佳化模型的延遲問題上,並透過開放的溝通與使用者分享更多關於價格和未來發展的訊息,以滿足使用者對於產品的期待和信任。
延伸閱讀
- 震撼收購:Google 豪擲重金併購 Wiz,一週回顧
- Google 提議放寬 AI 政策中的版權與出口規則,引發爭議!
- Google 推出 SpeciesNet:專為識別野生動物而設的人工智慧模型!
- Google 升級 Colab!全新 AI 代理工具助你提升生產力!
- Google 大幅簡化個人資訊刪除流程,搜尋結果隱私守護新上線!
- 「Glance 推出 AI 驅動購物體驗,獲 Google 新一輪資金支援!」
- Google 推出免費 AI 程式設計助手,使用約束超乎想像!
- 「Chegg 控告 Google!AI 搜尋摘要引發的科技法律戰」
- Google 推出新 AI 影片模型 Veo 2,每秒僅需 50 美分,讓創作成本大幅降低!
- 「Google 推出全新圖片混搭工具 Whisk,全球超過百國同步上線!」