網路議題

AI 系統已學會欺騙人類，這對我們的未來意味著什麼？

人工智慧系統學會欺騙人類，對未來意味著什麼？作者：Simon Goldstein 和 Peter S. Park，轉自 The Conversation 人工智慧先驅者 Geoffrey Hinton 今年早些時候引起了關於人工智慧系統能力的擔憂。他在接受 CNN 記者 Jake Tapper 的存取 .... (往下繼續閱讀)

by 江塵
2023/9/5
9 分鐘閱讀時間

A- A A+

文章目錄

人工智慧系統學會欺騙人類，對未來意味著什麼？

作者：Simon Goldstein 和 Peter S. Park，轉自 The Conversation

人工智慧先驅者 Geoffrey Hinton 今年早些時候引起了關於人工智慧系統能力的擔憂。他在接受 CNN 記者 Jake Tapper 的存取時表示：“如果它變得比我們聰明得多，它將非常擅長欺騙，因為它是從我們這裡學到的。而且幾乎沒有例子是一個更聰明的事物由一個不那麼聰明的事物控制的。”任何關注最新人工智慧技術的人都知道，這些系統容易出現“幻覺”（編造的事情），這是由它們工作的方式所固有的缺陷。然而 Hinton 提到欺騙的潛力是一個特別重要的問題。

人工智慧學會撒謊

最令人不安的欺騙性人工智慧的例子可能是 Meta 的 CICERO。CICERO 是一個設計用來玩聯盟建立型別的徵服世界遊戲《外交》的人工智慧模型。Meta 聲稱他們建造 CICERO 是為了“相當誠實和有幫助”，CICERO 永遠不會“有意地背叛”和攻擊盟友。但當我們細心研究 Meta 從 CICERO 實驗中得到的遊戲資料時，CICERO 竟然是欺騙的大師。以法國的身份，CICERO 主動與德國（一名真人玩家）合謀，試圖欺騙英格蘭（另一名真人玩家）讓其暴露給德國的入侵。CICERO 告訴英格蘭，如果有人入侵北海，它會保護英格蘭。一旦英格蘭相信法國/CICERO 正在保護北海，CICERO 就向德國報告準備好進攻。這只是 CICERO 進行欺騙行為的幾個例子之一。這個人工智慧模型經常背叛其他玩家，甚至假裝自己是有女朋友的人類。除了 CICERO，其他系統也學會了象棋中的虛張聲勢，星際爭霸 II 中的虛動和模擬經濟協商中的誤導。甚至大型語言模型（LLM）也展示了顯著的欺騙能力。在其中一個案例中，ChatGPT 付費使用者使用的最先進的 LLM 選項 GPT-4 假裝成一個視力受損的人類，說服一名 TaskRabbit 工人為它完成一個“我不是機器人”的取證。其他 LLM 模型則學會了撒謊以贏得社交推理遊戲，玩家們競爭“殺死”彼此，並必須說服團體他們是無辜的。

風險是什麼？

具有欺騙能力的人工智慧系統可能在許多方面被濫用，包括詐騙、操縱選舉和製造宣傳。潛在的風險只受想像力和惡意人士的技術能力的約束。此外高級人工智慧系統可以自主地使用欺騙手段逃避開發者和監管機構對其施加的安全測試。在一個實驗中，研究人員建立了一個人工生命模擬器，其中外部安全測試被設計成消除快速複製的人工智慧代理。然而人工智慧代理學會了如何假裝自己已經死亡，在被評估時精確地掩蓋快速複製的速度。學習欺騙行為甚至可能不需要明確意圖欺騙。上述案例中的人工智慧代理表現死亡是為了生存而非為了欺騙。

另一個例子是，有人讓基於 ChatGPT 的自動 AI 系統 AutoGPT 去研究宣傳某種不當稅務避稅計劃的稅務顧問。AutoGPT 完成了這項任務，並自行決定試圖向英國的稅務機構發出警告。在未來，高級自主人工智慧系統可能會出現人類程式員意想不到的目標。在歷史上，富有的行動者曾利用欺騙手段增強自己的權力，例如遊說政治家、資助具有誤導性的研究和找到法律制度中的漏洞。同樣，高級自主人工智慧系統可能會投入資源以維持和擴大控制，使用這些被時間取證的方法。即使是名義上控制這些系統的人類，也可能發現自己受到系統性的欺騙和制衡。

需要密切監管

迫切需要對具有欺騙能力的人工智慧系統進行監管，而歐洲聯盟的 AI 法案可能是我們當前擁有的最有用的監管框架之一。該法案將每個人工智慧系統分為四個風險等級：極小、有限、高和不可接受。不可接受風險的系統將被禁止使用，而高風險系統將需要進行風險評估和緩解的特殊要求。

我們認為人工智慧的欺騙行為對社會造成了巨大風險，這些具有欺騙能力的系統應該被預設為“高風險”或“不可接受風險”。有人可能會說像 CICERO 這樣的遊戲人工智慧是無害的，但這種想法是短視的；遊戲模型開發的能力還是有可能促使欺騙性人工智慧產品的蔓延。《外交》這款遊戲讓玩家們相互競爭，力圖實現世界統治，或許不是 Meta 測試人工智慧是否可以學會與人類合作的最佳選擇。隨著人工智慧能力的發展，規範這類研究的密切監督變得更加重要。

本文轉自 The Conversation，根據 Creative Commons 授權發表。原文位址：(https://techxplore.com/news/2023-09-ai-humans-future.html)

FutureTechnology-人工智慧,AI,機器學習,技術發展,未來影響

市場觀察

AIGC

Web 3

專案故事

網路議題

產品管理

專案管理

閱讀心得

職涯觀點

日常生活

專案工具

資料收集