「突破性評估人工智慧的「通」測試方法」

The Tong Test: A New Approach to Evaluating Artificial General IntelligenceIntroduction 一項最新的技術評估研究提出了一種評估人工通用智慧（AGI）的新方法，並引入了「通測試」（Tong test）的概念。該創新方法 .... (往下繼續閱讀)

by 程宇肖
2023/9/22
3 分鐘閱讀時間

A- A A+

文章目錄

The Tong Test: A New Approach to Evaluating Artificial General Intelligence

Introduction

一項最新的技術評估研究提出了一種評估人工通用智慧（AGI）的新方法，並引入了「通測試」（Tong test）的概念。該創新方法旨在透過動態體現的物理和社會互動（DEPSI）集中於標準化、量化和客觀的評估系統，提供對 AGI 進行評估的標準方法。這一新方法突顯了 DEPSI 的重要性，為 AGI 的定義和評估帶來了新的視角。

The Need for a New Evaluation System

隨著生成預訓練轉換器（GPT）系列的迅速發展，AGI 已經成為人工智慧（AI）領域的熱點。然而對 AGI 的定義和評估一直是一個挑戰。傳統上，AI 的評估指標是以任務為導向的，而通測試則將焦點轉向以能力和價值為導向的評估。

The Tong Test: Evaluating AGI through DEPSI

通測試在虛擬平臺上支援訓練和測試體現 AI，使 AI 代理能夠互動地獲取訊息，學習並微調其價值觀和能力。通測試提出五個關鍵特徵，可作為 AGI 評估的基準：無限任務、自主生成任務、價值對齊、因果理解和體現。這些特徵為系統評估提供了基礎，透過 DEPSI 的虛擬環境劃分 AGI 的裏程碑。

A Comprehensive and Inclusive Evaluation Approach

與傳統的 AI 測試系統不同，通測試提供了一種更全面和包容的評估方法。它結合了一個通用的算法測試範式和一個基於人和 AI 互動的測試範式，靈感來自圖靈測試的哲學。通測試的虛擬平臺生成具有動態體現互動場景的無限任務，涵蓋了各種能力和價值的維度。通測試平臺包括基礎設施、DEPSI 環境和評估工具等基本元件。這一結合提供了一條實際的途徑，建立一個具有無窮任務的體現平臺，在人類互動中對 AI 算法進行評估。

Implications and Impact

透過引入通測試，這篇觀點文章為 AGI 的標準化和客觀評估

"Artificialintelligence"-人工智慧,通測試方法,突破性評估

產品管理

專案管理

Web 3

AIGC

專案故事

專案工具

網路議題

閱讀心得

軟體測試

程式筆記

職涯觀點

日常生活

市場觀察

資料收集