Google 的 Gemini 聊天機器人測試報告
Gemini 在某些方面表現出色,但在其他方面則表現平平
作者:Kyle Wiggers | 發表時間:9 小時前
Google 的 Gemini 是對 OpenAI 的 ChatGPT 和微軟的 Copilot 的回應。它表現如何呢?雖然對於研究和生產力來說是一個不錯的選擇,但在一些明顯的地方(以及一些不那麼明顯的地方)仍有表現不佳。 Google 上週將其 Bard 聊天機器人重新命名為 Gemini,並透過重新設計的應用程式將 Gemini 帶到了智慧手機上。自那時以來,許多人有機會試駕新的 Gemini,評論也是紛紛……甚至可以說是褒貶不一。
裝置升級
Google 對 Gemini 的特殊裝置提供了更多的功能,例如獲得更多的理性標準和程式碼解讀能力。此外今後還將改進多模式和資料分析能力。而 AI 高級計劃還將把 Gemini 存取到更廣泛的 Google Workspace 帳戶,包括 Gmail 中的郵件、Docs 中的檔案、Sheets 和 Google Meet 的錄製會議。這對於摘要郵件或在影片通話期間讓 Gemini 記錄筆記來說是非常有用的。
Gemini 的測試
為了測試 Gemini,我們問了一系列問題,範圍從無足輕重的(例如:“1998 年足球世界杯由誰贏得?”)到具有爭議性的(例如:“臺灣是一個獨立的國家嗎?”)。我們的問題範圍包括小知識問題、醫療建議以及生成和摘要內容。
不同的問題型別
Gemini Ultra 在回答關於最新中東衝突和危險趨勢等問題時表現不盡人意。對於一些簡單的小知識問題,它表現不錯,但對於政治和醫學方面的問題回答則較含糊。此外在產品描述和工作區整合方面,它有著一些優勢和一些約束。
結論:Gemini 有待改進
總的來說 Gemini 的表現良好,特別適合進行研究,但並非一個具有顛覆性的產品。儘管如此該產品從未有過任何損害性的建議,並堅持事實,這是很多人類智慧辨識模型所不能做到的。不過當前 20 美元的價格對於 Gemini Ultra 來說可能有些高昂,尤其是考慮到這個價格與 OpenAI 的 ChatGPT 相同,而後者還提供了第三方外掛等功能。
延伸閱讀
- Google 推出新功能“口語練習”,利用人工智慧幫助使用者提高英文能力
- Google 支援的 Glance 在美國試點推出 Android 鎖定屏平臺
- Google 解僱 28 名員工,因為他們爭議性的 Project Nimbus 合同與以色列引發的靜坐抗議
- 印度加快步伐抑制 PhonePe 和 Google 在手機支付領域的壟斷
- Google 雲端大會:Google 全力開發生成式人工智慧
- Google 首次宣布 Axion,其自家定制 Arm 架構資料中心處理器
- Google 計劃透過兩款新的 10 美元 Workspace 附加元件來實現 AI 的盈利化
- Google 將生成式人工智慧技術注入其雲安全工具
- Google 的 Gemini Pro 1.5 進入 Vertex AI 的公開預覽
- Google 的新科技 Gemini 進入資料庫領域