Google 的 Gemini 聊天機器人測試報告 - 表現如何？

Google 的 Gemini 聊天機器人測試報告 Gemini 在某些方面表現出色，但在其他方面則表現平平作者：Kyle Wiggers | 發表時間：9 小時前 Google 的 Gemini 是對 OpenAI 的 ChatGPT 和微軟的 Copilot 的回應。它表現如何呢？雖然對於研究和生產 .... (往下繼續閱讀)

by 程宇肖
2024/2/15
4 分鐘閱讀時間

A- A A+

文章目錄

Google 的 Gemini 聊天機器人測試報告

Gemini 在某些方面表現出色，但在其他方面則表現平平

作者：Kyle Wiggers | 發表時間：9 小時前

Google 的 Gemini 是對 OpenAI 的 ChatGPT 和微軟的 Copilot 的回應。它表現如何呢？雖然對於研究和生產力來說是一個不錯的選擇，但在一些明顯的地方（以及一些不那麼明顯的地方）仍有表現不佳。 Google 上週將其 Bard 聊天機器人重新命名為 Gemini，並透過重新設計的應用程式將 Gemini 帶到了智慧手機上。自那時以來，許多人有機會試駕新的 Gemini，評論也是紛紛……甚至可以說是褒貶不一。

裝置升級

Google 對 Gemini 的特殊裝置提供了更多的功能，例如獲得更多的理性標準和程式碼解讀能力。此外今後還將改進多模式和資料分析能力。而 AI 高級計劃還將把 Gemini 存取到更廣泛的 Google Workspace 帳戶，包括 Gmail 中的郵件、Docs 中的檔案、Sheets 和 Google Meet 的錄製會議。這對於摘要郵件或在影片通話期間讓 Gemini 記錄筆記來說是非常有用的。

Gemini 的測試

為了測試 Gemini，我們問了一系列問題，範圍從無足輕重的（例如：“1998 年足球世界杯由誰贏得？”）到具有爭議性的（例如：“臺灣是一個獨立的國家嗎？”）。我們的問題範圍包括小知識問題、醫療建議以及生成和摘要內容。

不同的問題型別

Gemini Ultra 在回答關於最新中東衝突和危險趨勢等問題時表現不盡人意。對於一些簡單的小知識問題，它表現不錯，但對於政治和醫學方面的問題回答則較含糊。此外在產品描述和工作區整合方面，它有著一些優勢和一些約束。

結論：Gemini 有待改進

總的來說 Gemini 的表現良好，特別適合進行研究，但並非一個具有顛覆性的產品。儘管如此該產品從未有過任何損害性的建議，並堅持事實，這是很多人類智慧辨識模型所不能做到的。不過當前 20 美元的價格對於 Gemini Ultra 來說可能有些高昂，尤其是考慮到這個價格與 OpenAI 的 ChatGPT 相同，而後者還提供了第三方外掛等功能。

ArtificialIntelligence-Google,Gemini,聊天機器人,測試報告,表現

產品管理

專案管理

Web 3

AIGC

專案故事

專案工具

網路議題

閱讀心得

軟體測試

程式筆記

職涯觀點

日常生活

市場觀察

資料收集