
GPT-3:能和大學生一樣思考的人工智慧
概述
根據加州大學洛杉磯分校(UCLA)心理學家的研究,人工智慧語言模型 GPT-3 在解決一般智力測試和標準化考試(如 SAT)中的類比推理問題上表現出與大學本科生相當的能力。這項研究顯示了 GPT-3 可能具有類似人類思考的能力,引起了對於人工智慧的哲學性思考。
問題討論:GPT-3 的思考方式
這項研究引發了一個重要的問題:GPT-3 是透過模仿人類推理能力而達到這樣的成果,還是透過基於其大量語言訓練資料集的一種全新的認知過程來實現的?但是由於 OpenAI 所保護的 GPT-3 內部執行方式未公開,UCLA 科學家無法確保其思考能力的具體執行方式。他們也指出,儘管 GPT-3 在某些推理問題上的表現遠超他們的預期,但在其他問題上卻表現出顯著的失敗。因此需舉一個更廣泛的哲學性問題:GPT-3 是否具有真正的智慧,還是僅僅是透過模仿人類思考達到了類似的能力?
研究結果:GPT-3 的推理能力
根據該研究,GPT-3 在解決類似 Raven 進步矩陣測試的問題上表現出與人類相近的能力。這些問題要求主題預測一個由形狀組成的複雜序列的下一個影象。GPT-3 的正確率達到了 80%,明顯高於大學生的平均分數,但與最高分數的人類得分在同一範圍內。此外研究人員還發現 GPT-3 在解決未曾在網路上公開的 SAT 題目時表現優於人類的平均分數。值得一提的是,GPT-4,OpenAI 最新版本的技術,在這些考題上的表現優於 GPT-3,但仍不及 GPT-3。
然而 GPT-3 在解決基於簡短故事的類比問題時表現不如學生。研究人員提到,他們已經開發了一個受人類認知啟發的計算機模型,並將其與商業人工智慧進行比較。過去,其心理學計算機模型在類比問題上一直表現最佳,但直到去年 12 月,當他們得到 GPT-3 的最新更新版本時,才發現 GPT-3 的表現可以與他們的模型相媲美,甚至更好。
研究的約束和未來方向
研究人員指出,儘管 GPT-3 在某些推理任務上表現出色,但它仍然存在一些明顯的約束。特別是在解決需要理解物理空間的問題時,GPT-3 無法提供合理的解決方案。例如,當提供一組可以用來將糖果從一個碗轉移到另一個碗的工具的描述時,GPT-3 提出的解決方案是荒謬的。這表明 GPT-3 在理解物理空間方面存在明顯的困難。此外研究人員還提到,他們需要更深入地理解 AI 模型的認知過程,這需要獲得軟體和用於訓練的資料的存取許可權。未來的研究可能會探討 AI 模型是否真正開始“思考”像人類一樣,還是僅僅是表面上模仿人類思考的能力。
編者意見
GPT-3 的能力顯示了人工智慧語言模型的可觀進步。它在推理和類比問題上的表現表明,語言模型可能具有更接近人類思考的能力,並且能夠處理抽象和邏輯問題。然而研究人員提到 GPT-3 和人類之間尚存在差距,尤其是在理解物理空間和處理實際任務方面。這表明 GPT-3 還有待進一步的改進和發展。
在未來,我們應該對 GPT-3 和類似的人工智慧技術保持謹慎態度。儘管它們在某些方面表現出色,但它們仍然有約束和缺陷。人工智慧技術應該作為輔助工具使用,而不是取代人類智慧。我們應該將 AI 視為提供有價值的訊息和輔助決策的工具,但仍然需要人類的判斷和審慎。
結語與建議
GPT-3 的能力為未來的人工智慧發展提供了有價值的示範。然而在將人工智慧應用於關鍵任務或涉及重大影響的領域時,應該進行更多的測試和評估。我們需要確保人工智慧的決策過程是透明且可理解的,並且具有可追溯性,以便對其結果進行有效監督和調整。
同時我們還需要重視倫理和社會影響的問題。人工智慧的應用可能對社會和個體產生重要影響,因此需要制定相應的政策和規範。討論這些問題應該進行公開且廣泛的對話,包括科學家、政策制定者、業界和公眾的參與。
最後作為個體,我們應該學會適應和應對不斷變化的科技環境。這包括提高自身的科學素養,理解人工智慧的潛力和約束以及保持持續學習的態度和技能更新。
參考資料:
- Taylor Webb, Emergent analogical reasoning in large language models, Nature Human Behaviour (2023). DOI: 10.1038/s41562-023-01659-w.
- GPT-3 can reason about as well as a college student, psychologists report (2023, July 31) Retrieved from https://techxplore.com/news/2023-07-gpt-college-student-psychologists.html
延伸閱讀
- 「專為大學生打造的社交媒體新星 Connyct,能否在 TikTok 禁令風險下崛起?」
- 2024 年英國成年人上網時間激增近一小時,Ofcom 報告驚人!
- 2024 年科技業裁員全面報告:你不可錯過的重要趨勢!
- 微軟報告:850 萬臺 Windows 裝置遭 CrowdStrike 故障影響!
- Fizz 匿名社交 App 釋出大學生專屬交易市集
- 穿插 AI 能源成本的 Google 環保報告
- Kleiner Perkins 領投 Fizz,一款針對 Gen Z 大學生的信用建立簽帳金融卡種子輪投資 1400 萬美元
- 訂閱型手機應用大多數不賺錢,最新報告顯示
- YouTube 主宰美國電視串流市場,尼爾森最新報告顯示
- AI 新聞閱讀器「+報告」上線!抵制點閱率陷阱,精簡新聞內容