產品管理

Google 的 Gemini 聊天機器人測試報告 - 表現如何?

Google 的 Gemini 聊天機器人測試報告 Gemini 在某些方面表現出色,但在其他方面則表現平平作者:Kyle Wiggers | 發表時間:9 小時前 Google 的 Gemini 是對 OpenAI 的 ChatGPT 和微軟的 Copilot 的回應。它表現如何呢?雖然對於研究和生產 .... (往下繼續閱讀)

分享到 Facebook 分享到 Line 分享到 Twitter

文章目錄

Google 的 Gemini 聊天機器人測試報告 - 表現如何?

GoogleGemini 聊天機器人測試報告

Gemini 在某些方面表現出色,但在其他方面則表現平平

作者:Kyle Wiggers | 發表時間:9 小時前

GoogleGemini 是對 OpenAI 的 ChatGPT 和微軟的 Copilot 的回應。它表現如何呢?雖然對於研究和生產力來說是一個不錯的選擇,但在一些明顯的地方(以及一些不那麼明顯的地方)仍有表現不佳。 Google 上週將其 Bard 聊天機器人重新命名為 Gemini,並透過重新設計的應用程式將 Gemini 帶到了智慧手機上。自那時以來,許多人有機會試駕新的 Gemini,評論也是紛紛……甚至可以說是褒貶不一。

裝置升級

GoogleGemini 的特殊裝置提供了更多的功能,例如獲得更多的理性標準和程式碼解讀能力。此外今後還將改進多模式和資料分析能力。而 AI 高級計劃還將把 Gemini 存取到更廣泛的 Google Workspace 帳戶,包括 Gmail 中的郵件、Docs 中的檔案、Sheets 和 Google Meet 的錄製會議。這對於摘要郵件或在影片通話期間讓 Gemini 記錄筆記來說是非常有用的。

Gemini 的測試

為了測試 Gemini,我們問了一系列問題,範圍從無足輕重的(例如:“1998 年足球世界杯由誰贏得?”)到具有爭議性的(例如:“臺灣是一個獨立的國家嗎?”)。我們的問題範圍包括小知識問題、醫療建議以及生成和摘要內容。

不同的問題型別

Gemini Ultra 在回答關於最新中東衝突和危險趨勢等問題時表現不盡人意。對於一些簡單的小知識問題,它表現不錯,但對於政治和醫學方面的問題回答則較含糊。此外在產品描述和工作區整合方面,它有著一些優勢和一些約束。

結論:Gemini 有待改進

總的來說 Gemini表現良好,特別適合進行研究,但並非一個具有顛覆性的產品。儘管如此該產品從未有過任何損害性的建議,並堅持事實,這是很多人類智慧辨識模型所不能做到的。不過當前 20 美元的價格對於 Gemini Ultra 來說可能有些高昂,尤其是考慮到這個價格與 OpenAI 的 ChatGPT 相同,而後者還提供了第三方外掛等功能。

ArtificialIntelligence-Google,Gemini,聊天機器人,測試報告,表現
程宇肖

程宇肖

Reporter

大家好!我是程宇肖,我對於科技的發展和應用有著濃厚的興趣,並致力於將最新的科技趨勢和創新帶給大家。科技領域的變化速度驚人,每天都有令人興奮的新發現和突破。作為一名部落格作者,我將帶領大家深入探索科技的奧秘和應用的無限可能。