網路議題

Google 稱巴德在數學和程式設計方面有進步

Google 發布技術部落格稱巴德在數學和程式設計方面進步 Google 近日發布技術部落格,聲稱其智慧聊天機器人巴德(Bard)在邏輯和推理任務方面緩慢進步,並透露此進步歸功於一種名為"隱式程式碼執行"的技術。部落格解釋說,巴德等大型語言模型(Large Language Models, LLMs) .... (往下繼續閱讀)

分享到 Facebook 分享到 Line 分享到 Twitter

文章目錄

Google 稱巴德在數學和程式設計方面有進步

Google 發布技術部落格稱巴德數學和程式設計方面進步

Google 近日發布技術部落格,聲稱其智慧聊天機器人巴德(Bard)在邏輯和推理任務方面緩慢進步,並透露此進步歸功於一種名為"隱式程式碼執行"的技術。部落格解釋說,巴德等大型語言模型(Large Language Models, LLMs)本質上是預測引擎,當給定提示時,它們會透過預測句中可能出現的下一個詞語來生成回應。這使得它們在撰寫電子郵件和文章時非常高效,但在軟體開發等方面卻容易出錯。

部落格指出,與巴德和 ChatGPT 等競爭對手透過在網路、電子書和其他資源中訓練而成的全能自然語言模型不同,如 GitHub 的 Copilot 和 Amazon 的 CodeWhisperer 等生成程式碼的模型則幾乎完全是透過程式碼示例進行訓練和微調的。為解決通用 LLMs 在程式設計和數學方面的缺陷,Google 開發了"隱式程式碼執行",使得巴德能夠編寫和執行自己的程式碼。最新版本的巴德能夠識別可能有益於邏輯程式碼的提示,編寫並測試該程式碼,最終生成表面上更準確的回應。

Google 聲稱,基於內部基準測試,新版的巴德相對於之前的版本,在涉及計算的單詞和數學問題方面的回應提升了 30%。當然需要看看這些聲稱是否經得起外部測試的取證。巴德產品負責人傑克·克勞謝克(Jack Krawczyk)和工程副總裁阿馬納格·蘇布拉馬尼亞(Amarnag Subramanya)在部落格中寫道:"即使在這些改進之後,巴德仍不保證能夠永遠正確——例如,它可能不會編寫程式碼來幫助提示回應,它所生成的程式碼可能是錯誤的,巴德也可能沒有將執行的程式碼包含在其回應中。儘管如此這種改進的能力以及與邏輯驅動下的結構化能力作出回應是使巴德變得更加有用的重要一步。"

評論

巴德作為一款 AI 聊天機器人的推出本來是 Google 在競爭對手中佔據優勢的策略之一。然而巴德最初的亮相卻麻煩不小,引起了負面評價和市場波動。相較於 Bing Chat 和 ChatGPT 等競爭對手,巴德的表現一度受到質疑。透過引入"隱式程式碼執行"和其他增強功能,Google 試圖解決巴德數學和程式設計方面的不足,以留住使用者和提升市場份額。然而這些增強功能是否足以使得巴德趕上 ChatGPT 等領先的生成 AI 聊天機器人的腳步,還需要進一步觀察其成效。

建議

面對像巴德這樣的 AI 聊天機器人,使用者需要持有一定的懷疑和批判的態度。即使巴德現在能夠在數學和程式設計相關的問題上有所進步,其效能依然存在著不確保性和誤差率。在使用 AI 聊天機器人時,使用者可以透過多方渠道的比較和分析,以自己的需求和專業背景為參考,選擇更加適合自己的工具。此外對於開發 AI 聊天機器人的廠商而言,需要在推出前進行充分的測試和評估,避免因效能不佳而對品牌形象造成負面影響。

Progress-Google,巴德,數學,程式設計,進步
程宇肖

程宇肖

Reporter

大家好!我是程宇肖,我對於科技的發展和應用有著濃厚的興趣,並致力於將最新的科技趨勢和創新帶給大家。科技領域的變化速度驚人,每天都有令人興奮的新發現和突破。作為一名部落格作者,我將帶領大家深入探索科技的奧秘和應用的無限可能。