網路議題

問答時間：AI 模型如何自我學習來學習新事物

人工智慧模型如何自我學習新事物？簡介大型語言模型（例如 OpenAI 的 GPT 模型系列和 Google Bard）的內在執行方式對於它們的開發者來說仍然是個謎。然而 ETH Zurich 和 Google 的研究人員已經揭示了其中一個可能的關鍵機制，解釋這些模型如何能夠根據與使用者的互動來學習和 .... (往下繼續閱讀)

by 程宇肖
2023/7/19
8 分鐘閱讀時間

A- A A+

文章目錄

人工智慧模型如何自我學習新事物？

簡介

大型語言模型（例如 OpenAI 的 GPT 模型系列和 Google Bard）的內在執行方式對於它們的開發者來說仍然是個謎。然而 ETH Zurich 和 Google 的研究人員已經揭示了其中一個可能的關鍵機制，解釋這些模型如何能夠根據與使用者的互動來學習和精進答案。該研究結果由 ETH 的博士生 Johannes von Oswald 在其所在的小組中進行，該小組是由 ETH 理論電腦科學教授 Angelika Steger 領導的，並研究用於神經網路的學習算法。

這項研究成果將在 7 月下旬的國際機器學習大會（ICML）上發表，並且已經在 arXiv 預印本伺服器上提供閱讀。

轉換器（Transformers）和它們在現代人工智慧中的普及

轉換器是一種特殊的人工神經網路結構。它被大型語言模型（如 ChatGPT）所使用，但是在 2017 年由 Google 的研究人員提出之後，才真正聲名大噪，因為它在語言翻譯方面取得了最先進的成果。有趣的是，這種結構的稍微修改版本早在 1991 年就由人工智慧先驅 Jürgen Schmidhuber 開發出來。

轉換器與之前的人工智慧模型有一個重要區別。之前的模型，如影象分類和語言翻譯，都使用了針對特定領域進行專門設計的模型結構。而轉換器，不管是什麼樣的任務，似乎都能取得極佳的效果。由於它們的廣泛應用，理解它們的工作原理是非常重要的。

研究結果

傳統上，神經網路被認為是一個可以根據輸入生成輸出的黑盒子。然而我們的研究表明，轉換器可以自我學習，在其結構內部實現算法。我們成功證實，轉換器可以實現一種經典而強大的機器學習算法，該算法能夠根據最近接收到的訊息學習。

例如，你可以向語言模型提供幾段文字，並提供與每段文字相關的情感（正向或負向）。然後，你可以向模型提供一段之前未見過的文字，並根據你提供的範例，模型將預測該文字是正向還是負向。

是的，確實如此。在進行訓練時，模型只需要預測即將到來的情況，並且在這種壓力下發展出了一種從與使用者的對話中學習的技術。我們將這種學習方式稱為"在上下文中學習"。

轉換器僅僅接收到文字輸入，但它如何利用這些極少的訊息來最佳化其輸出呢？

我們的研究顯示一種可能的方式是學習一個我們可以稱之為"世界模型"的東西，這樣你可以進行預測。有趣的是，這種學習是在已經訓練的轉換器內部進行的。通常情況下，學習牽涉到改變模型神經網路中的存取。而我們的研究表明，轉換器模型在其固定的神經架構內部模擬了相同的學習過程。

轉換器的學習機制

我們在研究中假設，轉換器具有對學習的靜態偏好，這意味著學習機制的發展在其基本設計中已經內含，即使在模型訓練之前就已經存在。

GPT-3 作為 ChatGPT 背後的模型，具有 1750 億個引數。您如何研究這樣一個大型系統？

有不同的方法可以嘗試理解這些系統。一些研究人員採取心理學的方法，分析模型在面對標準化測試或道德困境等衝突情況下的反應。我們則採取了類似於神經科學的機制研究方法。進一步擴充套件這個比喻，因為我們的模型是執行在計算機上的，我們能夠記錄其神經網路中的每一個神經元和存取——這些對於對動物或人類的生物大腦進行研究是無法想象的。

當前只有當研究具有特定現象的相對較小的神經網路結構時，才有可能在個別神經元的層面進行研究。

研究中所使用的系統

我們在研究中使用的轉換器與常用的轉換器結構基本相同。我們並沒有將系統訓練在網際網路上的所有文字上，而是在簡單問題的例子上進行訓練，這個問題被稱為線性回歸。由於這個問題及其解決方案已經非常好地被理解，我們能夠將已知解與在轉換器內部觀察到的結果進行比較。我們確認在轉換器內部實現了一種被稱為梯度下降的非常著名且有效的學習算法。

展望未來

對於這一研究趨勢的長期目標可能是確保轉換器是否能夠發現新的演算法，甚至證實定理並發展我們尚不熟悉的數學。這將是一個真正了不起且具有突破性的成果。

總之我們的研究揭示了轉換器模型如何能夠在其固定的神經網路結構內實現自我學習的算法。這項研究成果不僅對於理解人工智慧模型的工作原理具有重要意義，也對於改進這些模型的效能有實際應用價值。

（此文經原作嚴重修改，編輯人員：）

Learning-AI 模型,自我學習,學習新事物

市場觀察

AIGC

Web 3

專案故事

網路議題

產品管理

專案管理

閱讀心得

職涯觀點

日常生活

專案工具

資料收集