
<div><h2>AI 是否已接近透過圖靈測試?當它成功透過測試後會發生什麼?</h2>
<h3>介紹</h3>
<p>自從 1950 年英國電腦科學家艾倫·圖靈提出了圖靈測試(Turing test)的概念,人工智慧(AI)逐步接近透過這一測試的可能性。圖靈測試旨在取證 AI 是否擁有與人類類似的智慧。然而測試本身存在一些局限性,並且有人質疑圖靈測試是否真能有效衡量 AI 的智慧。本文將探討圖靈測試的局限性以及衡量 AI 能力的其他替代方式。</p>
<h3>圖靈測試的局限性</h3>
<p>圖靈測試的一個主要問題是可能產生誤判。大部分的大型語言模型(如 GPT-4)在回答問題時會明確宣告自己是 AI。這種程式化的設定可能會約束 AI 展示透過圖靈測試所需的智慧。另外一些哲學家指出,只要將 AI 設定成對所有可能的輸入都具有類似人類的反應,AI 可能就能透過圖靈測試,即使其實際智慧能力不足。</p>
<p>此外圖靈測試聚焦於人類認知能力,若 AI 的認知能力與人類有所不同,那麼專業的測試者就能找到某些任務,區分 AI 和人類的表現。換句話說,雖然透過圖靈測試可以提供一些證據表明一個系統具有智慧,但未透過測試並不代表該系統毫無智慧。此外圖靈測試也無法回答 AI 系統是否具有意識、是否能感受痛苦和快樂以及是否具有道德意義。</p>
<h3>衡量 AI 能力的替代方式</h3>
<p>圖靈測試基於一種邏輯:人類具有智慧,所以任何能夠有效模仿人類的東西也有可能是具有智慧的。然而這種邏輯並未提供關於智慧的本質的任何說明。另一種衡量 AI 智慧的方式是更深入地思考智慧的含義。當前還沒有任何一個單一的測試能夠權威性地衡量人工或人類的智慧。在最廣泛的層面上,智慧可以被理解為在不同環境中實現各種目標的能力。更智慧的系統是能夠在更廣泛的環境中實現更廣泛目標的系統。因此評估通用 AI 系統設計的進展的最佳方式是在各種任務中測試其表現。</p>
<p>機器學習研究人員已在這方面開發了一系列基準。例如,GPT-4 在大規模多工語言理解方面的測試中能夠正確回答 86%的問題。這個基準測試了在一系列大學程度學科的多選測試中的表現。它在 AgentBench 測試中也表現良好,AgentBench 是一個可以衡量大型語言模型的代理能力的工具,例如瀏覽網頁,線上購物以及參加遊戲等。</p>
<h3>圖靈測試的相對影響力</h3>
<p>圖靈測試是對模仿和 AI 模擬人類行為能力的一種衡量。大型語言模型是高手模仿者,並具有透過圖靈測試的潛力。然而智慧並不等於模仿。智慧的種類與實現的目標一樣多。監測 AI 在發展一系列重要能力方面的進展是理解 AI 智慧的最佳方式。同時重要的是在討論 AI 是否具有智慧的問題時不要不斷改變目標。由於 AI 的能力不斷提升,反對 AI 智慧的批評者經常找到新的任務,以測試 AI 系統是否能夠完成,而 AI 系統每次都能突破這些障礙。</p>
<h4>結論</h4>
<p>AI 正逐步接近透過圖靈測試的可能性,但圖靈測試並不是衡量 AI 智慧的唯一標準。圖靈測試存在局限性,並且不回答 AI 是否具有意識、能感受痛苦與快樂的問題。衡量 AI 能力的替代方式包括透過各種任務的表現來評估 AI 的智慧。重要的是,我們在討論 AI 智慧時不斷改變目標,並思考 AI 可能具有的不同種類的智慧。</p></div><div>ArtificialIntelligence-wordpress,AI,智商,圖靈測試,人工智慧,智慧,機器學習,自然語言處理,</div>
延伸閱讀
- 開源開發者聯手對抗 AI 爬蟲:智慧與復仇的較量
- OpenAI 的創意寫作 AI 讓人想起高中文學社那個討人厭的孩子
- 亞馬遜成立新型代理 AI 團隊,將如何改變科技未來?
- 加州新 AI 法案出爐,SB 1047 作者再推出改革措施!
- 「搶先報名!TechCrunch Sessions: AI 演講者申請截止日期迫在眉睫!」
- MWC 最新報導:AI 影響力的兩極化觀點首次曝光!
- 《超級瑪利歐成為 AI 基準測試的新標準!你絕對想不到的理由》
- Google 推出 SpeciesNet:專為識別野生動物而設的人工智慧模型!
- 安瑟普提克獲得 35 億美元巨額資金 瞄準人工智慧未來!
- OpenAI 重磅推出 GPT-4.5:歷史上最大的語言模型來了!