
<div><h2>AI 時代的遺忘權</h2>
<p>2023 年 9 月 12 日編者註:本文已根據 Science X 的編輯流程和政策進行審核。在確保內容可信度的同時編輯們特別強調以下特點:事實核查、預印本可靠來源、校對。本文撰寫者 Alice Trend、David Zhang 和 Thierry Rakotoarivelo 所著的《大型語言模型時代的遺忘權:影響、挑戰和解決方案》被引用。</p>
<p>今年早些時候,由於懷疑侵犯隱私,ChatGPT 在義大利被短暫禁用。為了助其解禁,ChatGPT 的母公司 OpenAI 承諾提供一種方式,讓公民反對使用他們的個人資料來訓練人工智慧(AI)模型。遺忘權法在一些國家的網路隱私權中起著重要作用。它賦予個人要求科技公司刪除他們的個人資料的權利。該法案是透過 2014 年歐洲聯盟(EU)涉及搜尋引擎的具有裏程碑意義的案例確立的。</p>
<h3>LLMs 與搜尋引擎的區別</h3>
<p>然而一旦公民反對在人工智慧訓練中使用他們的個人資料,接下來會發生什麼呢?事實證實,這並沒有那麼簡單。我們的網路安全研究員 Thierry Rakotoarivelo 是最近在 arXiv 預印伺服器上發表的關於機器遺忘的論文的共同作者。他解釋說,將遺忘權應用於像 ChatGPT 這樣的大型語言模型(LLMs)比應用於搜尋引擎困難得多。</p>
<p>拉科託阿裏韋洛說:“如果公民要求從搜尋引擎中刪除他們的個人資料,相關的網頁可以從搜尋結果中刪除和移除。”他補充道:“對於 LLMs 來說情況更加復雜,因為它們沒有儲存特定的個人資料或檔案的能力,也不能根據命令檢索或遺忘特定的訊息片段。”</p>
<h3>個人資料在 LLMs 中的運行方式</h3>
<p>LLMs 透過在訓練過程中從大型資料集中學到的模式來生成回答。拉科託阿裏韋洛解釋說:“它們不會搜尋網際網路或索引網站來尋找答案。相反,它們根據查詢提供的上下文、模式和詞語之間的關係,預測回答中的下一個詞。”</p>
<p>我們的另一位領先網路安全研究員 David Zhang 是《大型語言模型時代的遺忘權:影響、挑戰和解決方案》的第一作者。他對人類如何使用已學得的訓練資料進行語音生成也給出了一個很好的比喻。他說:“就像澳大利亞人可以根據從國際體育賽事中獲得的訓練資料預測在‘澳洲人,澳洲人,澳洲人’之後該說‘喂,喂,喂’一樣,LLMs 也使用它們的訓練資料來預測下一步該說什麼。”</p>
<h3>LLMs 為什麼容易產生錯誤回答?</h3>
<p>當 LLMs 對提示產生不正確的答案時,就被認為是“產生幻覺”。然而張兆說幻覺是 LLMs 產生答案的方式。“幻覺不是大型語言模型的錯誤,而是基於它們的設計特性。”張兆說。“它們也無法獲取實時資料或在訓練截止後進行更新,這可能導致生成過時或不正確的訊息。”</p>
<h3>如何使 LLMs 遺忘?</h3>
<p>機器遺忘是當前最有潛力的應用,用於使 LLMs 遺忘之前訓練資料,但這是一個複雜的過程。事實上 Google 已向全球研究人員發出挑戰,以推進這一解決方案。一種機器遺忘的方法是透過加速重新訓練模型的特定部分來刪除確切的資料點。這樣可以避免重新訓練整個模型所帶來的成本和時間消耗。但首先需要找出哪些部分的模型需要重新訓練,而且這種分段方法可能會在刪除可能重要的資料點時產生公平性問題。其他方法包括逼近方法,以取證、消除和防止資料退化和對算法的對抗性攻擊。張兆和他的同事提出了一些臨時方法,包括在開發更好的修復方法或正在訓練修改資料集的新模型時,對模型進行編輯以進行快速修復。在他們的論文中,研究人員使用巧妙的提示來使模型忘記一個著名的醜聞,提醒模型該訊息已受到遺忘請求的約束。</p>
<h2>記住並從錯誤中學習的重要性</h2>
<p>對於 LLMs 持續引發的資料隱私問題,如果在工具的整個生命周期中嵌入負責任的 AI 開發原則,可能本可避免這些問題。市場上大多數知名的 LLMs 都是“黑盒子”。換句話說,使用者無法理解它們的內部運行方式以及它們如何得出結果或決策。可解釋的人工智慧描述的是模型的決策過程可以被人類追蹤和理解的情況(與“黑盒子”人工智慧相對)。當很好地使用可解釋的人工智慧和負責任的人工智慧技術時,我們可以對模型中的任何問題的根本原因有所理解,因為每一步都是可以解釋的,這有助於發現和解決問題。透過在新技術開發中應用這些以及其他人工智慧倫理原則,我們可以幫助評估、調查和減輕這些問題。</p>
<p><em>本文引用:</em>“The right to be forgotten in the age of AI (2023, September 12)。”取自<a href="https://techxplore.com/news/2023-09-forgotten-age-ai.html">https://techxplore.com/news/2023-09-forgotten-age-ai.html</a>,版權所有。</p></div><div>Technology-人工智慧,資料隱私,資料保護,個人隱私,資料安全,資料倫理,</div>
延伸閱讀
- 加州新 AI 法案出爐,SB 1047 作者再推出改革措施!
- 《超級瑪利歐成為 AI 基準測試的新標準!你絕對想不到的理由》
- Google 推出 SpeciesNet:專為識別野生動物而設的人工智慧模型!
- 安瑟普提克獲得 35 億美元巨額資金 瞄準人工智慧未來!
- 英國深入調查 TikTok、Reddit 和 Imgur 如何保障兒童隱私!
- OpenAI 重磅推出 GPT-4.5:歷史上最大的語言模型來了!
- 探索 DeepSeek:你必須理解的 AI 聊天機器人應用全指南!
- OpenAI 的創業帝國:揭密其風投基金背後的諸多創新公司
- 揭開 Mistral AI 的神祕面紗:揭示 OpenAI 競爭者的所有祕密!
- 未來科技:研究人員揭示如何打造變形機器人,猶如 T-1000 般神奇!