網路議題

人工智慧代理如何模擬人類文明的奧祕

深入研究:開放 AI 的語言模型對人類行為進行模擬人工智慧語言模型的崛起隨著人工智慧(AI)大型語言模型(LLM)的出現,如 OpenAI 的 GPT-3、3.5 和 4,我們能夠編碼關於我們的生活、溝通和行為的大量訊息。研究人員不斷探索如何利用這些知識。斯坦福大學最近進行的一項研究表明,透過正確的 .... (往下繼續閱讀)

分享到 Facebook 分享到 Line 分享到 Twitter

文章目錄

人工智慧代理如何模擬人類文明的奧祕

深入研究:開放 AI 的語言模型對人類行為進行模擬

人工智慧語言模型的崛起

隨著人工智慧(AI)大型語言模型(LLM)的出現,如 OpenAI 的 GPT-3、3.5 和 4,我們能夠編碼關於我們的生活、溝通和行為的大量訊息。研究人員不斷探索如何利用這些知識。斯坦福大學最近進行的一項研究表明,透過正確的設計,可以利用 LLM 模擬人類行為,並以一個具有動態和具有說服力的真實感的方式進行模擬。該研究探討了生成模型在建立具有記錄互動、反思所接收訊息以及基於不斷擴大的記憶流計劃長期和短期目標的 AI 代理架構中的潛力。這些 AI 代理能夠模擬人們在日常生活中的行為,包括平凡的任務和複雜的決策過程。此外當這些代理結合在一起時,它們可以模擬從大量人口的互動中產生的更加複雜的社會行為。這項工作開啟了許多可能性,尤其是在模擬人口動態、提供有關社會行為和互動的有價值的見解方面。

生成代理的虛擬環境

在該研究中,研究人員在一個名為 Smallville 的沙盒遊戲環境中模擬生成代理。該環境由各種物件組成,如餐廳、學校、酒吧等。這個環境由 25 個由 LLM 驅動的生成代理居住。LLM 以一個包含該代理的行為、職業、偏好、記憶和與其他代理之間關係的詳細描述為提示開始執行。LLM 生成的結果是代理的行為。代理透過行動與環境進行互動。起初,他們透過自然語言生成一個動作語句,例如“Isabella 正在喝咖啡。”然後,將此語句轉化為 Smallville 中的具體動作。此外代理透過自然語言對話相互溝通。他們的對話受到之前的記憶和過去的互動的影響。人類使用者還可以透過旁述者的聲音對代理進行對話,改變環境的狀態,或直接控制一個代理。這種互動設計旨在創造一個具有多種可能性的動態環境。

記憶和反思

SmallVille 環境中的每個代理都配備有一個記憶流,這是一個以自然語言記錄代理在經歷中的綜合資料庫。這個記憶流在代理的行為中起著關鍵作用。對於每個行動,代理會從記憶流中檢索相關的記憶來幫助其計劃行動。例如,如果代理第二次遇到另一個代理,它會檢索與該代理的過去互動的記錄。這使得代理可以找回以前的對話或跟進需要共同完成的任務。然而記憶檢索帶來了一個重大挑戰。隨著模擬時間的增加,代理的記憶流變得越來越長。將整個記憶流放入 LLM 的上下文中可能會分散模型的注意力。而一旦記憶流變得太長,它就無法放入 LLM 的上下文視窗中。因此對於與 LLM 的每一次互動,代理必須從記憶流中檢索與其當前情況最相關的內容,並將其作為上下文提供給模型。為理解決此問題,研究人員設計了一個檢索函數,該函數衡量了每個記憶片段對其當前情況的相關性。每個記憶的相關性是透過將其嵌入與當前情況的嵌入進行比較來衡量的(嵌入是表示文字不同含義的數值,用於相似性搜尋)。記憶的新近程度也很重要,這意味著近期的記憶被賦予更高的相關性。除此之外,研究人員設計了一個定期將記憶流的部分內容總結為更高層次抽象思維的函數,稱為“反思”。這些反思彼此疊加,為代理的個性和偏好提供了更加細緻的描述,並增強了將來行動的記憶檢索的質量。記憶和反思使得 AI 系統能夠為 LLM 制定豐富的提示,然後使用它來計劃每個代理的行動。

代理行動的規劃

代理的規劃是該專案中的另一個有趣方面。研究人員必須設計出一個系統,使代理能夠執行直接行動,同時也能夠為長期目標進行規劃。為了實現這一點,他們採用了一種分層的規劃方法。模型首先接收代理狀態的摘要,並被提示為長期目標制定一個高層次的計劃。然後,它遞迴地進行每一步,生成更具體的行動,首先以每小時的日程表,然後以 5-15 分鐘的任務。代理還會根據環境的變化以及觀察到的新情況或與其他代理的互動來更新他們的計劃。這種動態的規劃方法確保代理能夠適應環境,以真實和可信的方式與之互動。

模擬的結果

每個代理從一些基本知識、日常例行事項和目標出發。他們計劃和實現這些目標,並相互交流。透過這些互動,代理可以相互傳遞訊息。隨著新訊息在整個人口中的傳播,社區的行為也會發生變化。代理會根據對其他代理行為的觀察,改變或調整他們的計劃和目標。研究人員的實驗表明,生成代理學會在沒有明確指示的情況下相互協調。例如,其中一個代理的目標是舉辦一個情人節派對。這些訊息最終傳達給其他代理,有幾個代理最終參加了這個派對。(線上上已經發布了展示)。儘管這項研究結果令人印象深刻,但也必須承認該技術的局限性。生成代理,在模擬人類行為方面超越了其他基於 LLM 的方法,但有時在記憶檢索方面會失誤。他們可能會忽略相關記憶,或者相反,將不存在的細節新增到他們的回憶中。這可能導致他們的行為和互動的不一致性。此外研究人員還注意到代理的行為中的一個意外特點:他們過於有禮和合作。儘管這些特點在 AI 助手中可能是可取的,但它們並不能真實地反映人類行為的全部光譜,其中包括衝突和分歧。

人類行為之模擬

該研究引起了學術界的關注。斯坦福大學的研究人員最近發布了他們虛擬環境和生成代理的程式碼。這使得其他研究人員可以在這項工作基礎上進行研究,而一些知名企業(如著名的風險投資公司 Andreessen Horowitz (a16z))已經建立了自己的虛擬環境版本。儘管 Smallville 的虛擬代理很有趣,但研究人員認為他們的工作具有遠達的實際應用。其中一個應用是在社交網路等大型使用者產品中建立動態模型。研究人員希望這些生成模型可以幫助預測和減輕負面結果,如訊息傳播或惡意言論的傳播。透過建立一個多樣化的代理人口並觀察其在產品上的互動,研究人員可以研究新出現的行為,無論是積極的還是消極的。代理還可以用於實驗反事實情況,模擬不同政策和行為修改如何改變結果。這個概念是社交模擬的基礎。然而生成代理的潛力也伴隨著風險。它們可以被用來建立逼真地模模擬實人類的機器人,從而可能放大如大規模的訊息傳播等惡意活動。為了應對這個問題,研究人員提出維護代理行為的審計日誌,提供透明度和可追溯性的水平。“展望未來,我們認為生成代理可以在許多互動應用中扮演角色,範圍從設計工具到社交計算系統到沉浸式環境”,研究人員寫道。

結論

斯坦福大學的研究人員開展了一項有關利用開放 AI 的語言模型模擬人類行為的實驗研究。透過結合生成模型和虛擬環境,他們成功地模擬代理之間的互動和社會行為。這項研究的發現具有重要的學術和應用價值,可以幫助我們更好地理解人類行為和社會互動的執行方式。然而這項技術也存在風險和約束,需要進一步的研究和探索。在未來,生成代理可能會在各個領域扮演重要角色,從設計工具到社交計算系統。我們需要保持警覺,並與相關利益相關方共同努力,以確保技術的發展和應用符合道德和社會價值觀。

AISimulation-人工智慧,代理,模擬,人類文明,奧祕

程宇肖

程宇肖

Reporter

大家好!我是程宇肖,我對於科技的發展和應用有著濃厚的興趣,並致力於將最新的科技趨勢和創新帶給大家。科技領域的變化速度驚人,每天都有令人興奮的新發現和突破。作為一名部落格作者,我將帶領大家深入探索科技的奧秘和應用的無限可能。