網路議題

「突破性評估人工智慧的「通」測試方法」

The Tong Test: A New Approach to Evaluating Artificial General IntelligenceIntroduction 一項最新的技術評估研究提出了一種評估人工通用智慧(AGI)的新方法,並引入了「通測試」(Tong test)的概念。該創新方法 .... (往下繼續閱讀)

分享到 Facebook 分享到 Line 分享到 Twitter

文章目錄

「突破性評估人工智慧的「通」測試方法」

The Tong Test: A New Approach to Evaluating Artificial General Intelligence

Introduction

一項最新的技術評估研究提出了一種評估人工通用智慧(AGI)的新方法,並引入了「通測試」(Tong test)的概念。該創新方法旨在透過動態體現的物理和社會互動(DEPSI)集中於標準化、量化和客觀的評估系統,提供對 AGI 進行評估的標準方法。這一新方法突顯了 DEPSI 的重要性,為 AGI 的定義和評估帶來了新的視角。

The Need for a New Evaluation System

隨著生成預訓練轉換器(GPT)系列的迅速發展,AGI 已經成為人工智慧(AI)領域的熱點。然而對 AGI 的定義和評估一直是一個挑戰。傳統上,AI 的評估指標是以任務為導向的,而通測試則將焦點轉向以能力和價值為導向的評估。

The Tong Test: Evaluating AGI through DEPSI

通測試在虛擬平臺上支援訓練和測試體現 AI,使 AI 代理能夠互動地獲取訊息,學習並微調其價值觀和能力。通測試提出五個關鍵特徵,可作為 AGI 評估的基準:無限任務、自主生成任務、價值對齊、因果理解和體現。這些特徵為系統評估提供了基礎,透過 DEPSI 的虛擬環境劃分 AGI 的裏程碑。

A Comprehensive and Inclusive Evaluation Approach

與傳統的 AI 測試系統不同,通測試提供了一種更全面和包容的評估方法。它結合了一個通用的算法測試範式和一個基於人和 AI 互動的測試範式,靈感來自圖靈測試的哲學。通測試的虛擬平臺生成具有動態體現互動場景的無限任務,涵蓋了各種能力和價值的維度。通測試平臺包括基礎設施、DEPSI 環境和評估工具等基本元件。這一結合提供了一條實際的途徑,建立一個具有無窮任務的體現平臺,在人類互動中對 AI 算法進行評估。

Implications and Impact

透過引入通測試,這篇觀點文章為 AGI 的標準化和客觀評估

"Artificialintelligence"-人工智慧,通測試方法,突破性評估
程宇肖

程宇肖

Reporter

大家好!我是程宇肖,我對於科技的發展和應用有著濃厚的興趣,並致力於將最新的科技趨勢和創新帶給大家。科技領域的變化速度驚人,每天都有令人興奮的新發現和突破。作為一名部落格作者,我將帶領大家深入探索科技的奧秘和應用的無限可能。