
研究發現:AI 在視覺類比方面仍遠遜於人類智慧
引言
人工智慧在長期以來一直面臨著一個根本性問題:到底什麼是智慧?GPT-4 等 AI 模型的出現突顯出了這個不確保性:一些研究人員認為 GPT 模型體現出了真正的智慧的曙光,但也有人持相反觀點。為理解決這些爭論,西北高等研究學院(SFI)的研究人員阿爾謝尼·莫斯基切夫、梅蘭妮·米切爾和維克多·維克拉姆·奧杜瓦德在一篇最新論文中提出了具體的任務,以確保和測試智慧的概念。他們發現,即使是最先進的 AI 在抽象和概括概念方面仍遠遜於人類。
研究內容
研究團隊透過創造出基於 Google 研究員弗朗索瓦·科列特開發的領域的評估謎題,來進行評估。這些謎題關注視覺類比,涉及到基本概念,如上方、下方、中心、內部和外部等。研究人員讓人類和 AI 參加者觀看展示了一個概念的幾個圖案,然後要求他們將該概念應用於另一個影象。例如,下圖展示了對於“相同性”概念的測試。
[^2^]
結果顯示,這些視覺謎題對於人類來說非常容易:例如,在測試“相同性”概念時,人類的正確率達到了 88%。但 GPT-4 卻碰到了困難,只有 23%的謎題答對了。因此研究人員得出結論,當前的 AI 程式在視覺抽象推理方面仍然脆弱。
智慧和類比推理
莫斯基切夫表示:“類比推理在人類的思維過程中佔有重要地位,這也是為什麼這個問題如此有趣。”他們的研究使用了新穎的視覺謎題,以確保機器之前未曾遇到過這些問題。GPT-4 是透過對網際網路的大規模訓練來獲得的,因此避免讓它遇到任何之前可能遇到過的東西是非常重要的,以確保它不僅僅是在學習現有的文字而不是體現自己的理解。這就是為什麼像 AI 在一個酒吧考試中得分良好這樣的最近結果並不是對其真正智慧的好評。
對未來發展的建議
研究團隊認為,隨著時間的推移和 AI 算法的改進,開發評估程式將變得越來越困難且越來越重要。與其試圖創造一個測試 AI 智慧的測試,我們應該更加謹慎地設計特定智慧方面的資料集。莫斯基切夫表示:“我們的算法越來越好,就越難弄清楚它們能做什麼不能做什麼,因此我們需要在開發評估資料集方面非常周全。”
結論
這項研究發現,人工智慧在具有類比推理的視覺任務方面仍遠遜於人類智慧。這一結果突出了智慧的複雜性以及評估 AI 智慧的挑戰性。研究人員建議,我們應該繼續發展更多經過精心策劃的資料集,以更全面地評估 AI 的智慧能力。這將有助於推動人工智慧的發展,並加深我們對智慧本質的理解。
延伸閱讀
- AI 與影片履歷助力初入職場的新鮮人找到工作!
- OpenAI 的創意寫作 AI 讓人想起高中文學社那個討人厭的孩子
- 亞馬遜成立新型代理 AI 團隊,將如何改變科技未來?
- 加州新 AI 法案出爐,SB 1047 作者再推出改革措施!
- 「搶先報名!TechCrunch Sessions: AI 演講者申請截止日期迫在眉睫!」
- MWC 最新報導:AI 影響力的兩極化觀點首次曝光!
- 《超級瑪利歐成為 AI 基準測試的新標準!你絕對想不到的理由》
- Google 推出 SpeciesNet:專為識別野生動物而設的人工智慧模型!
- 安瑟普提克獲得 35 億美元巨額資金 瞄準人工智慧未來!
- OpenAI 重磅推出 GPT-4.5:歷史上最大的語言模型來了!