市場觀察

一項研究者利用《哈利波特》令人工智慧忘記受版權保護的資料

人工智慧語言模型擬人化的未來：新技術實現忘卻資訊的嘗試摘要：最近，微軟研究人員在一篇尚未經同行評審的論文中提出了一種新的方法，可以從一個大型語言模型中刪除特定的知識，例如哈利波特系列的內容。這項技術的發展意味著未來的人工智慧語言模型可能更易於進行定制或修改，以符合不同的要求或保護版權。背景：近年來大 .... (往下繼續閱讀)

by 程宇肖
2023/10/7
5 分鐘閱讀時間

A- A A+

文章目錄

人工智慧語言模型擬人化的未來：新技術實現忘卻資訊的嘗試

摘要：

最近，微軟研究人員在一篇尚未經同行評審的論文中提出了一種新的方法，可以從一個大型語言模型中刪除特定的知識，例如哈利波特系列的內容。這項技術的發展意味著未來的人工智慧語言模型可能更易於進行定制或修改，以符合不同的要求或保護版權。

背景：

近年來大型語言模型（如 OpenAI 的 ChatGPT 和 Meta 的 Llama 2）在自然語言處理領域取得了驚人的突破，具有理解和生成人類語言的能力。然而這些模型在訓練過程中，通常需要使用大量的文字資料，包括版權保護的內容。在這種情況下，刪除或遺忘特定知識或內容成為了一個重要的議題。

技術細節：

微軟的研究人員提出了一種三部曲的方法，可以近似地從語言模型中刪除指定的內容。首先他們使用哈利波特系列的內容訓練了一個模型，以識別最相關的單詞。其次他們透過使用通用的單詞替換哈利波特的特定表達方式，生成一個近似於刪除訓練內容的模型。最後他們對這個新模型進行了微調，使其遺忘原始的文字內容，當使用者選擇哈利波特相關的上下文時，它不再生成相關的內容。

研究結果：

研究人員測試了這個模型生成和討論哈利波特內容的能力，並透過檢查單詞機率等指標來評估其效果。他們發現，在僅僅一小時的微調後，哈利波特相關的複雜內容幾乎被完全遺忘。而在其他基準測試（如 ARC、BoolQ 和 Winogrande）中，模型的表現幾乎沒有受到影響。

討論：

這項研究的結果具有重要的倫理和法律意義。透過這項技術的發展，人們可以更好地控制語言模型的生成內容，以適應不同需求或保護版權。然而研究人員也提醒，該技術可能對虛構文字比對非虛構文字更有效，因為虛構世界中存在更多獨特的參考。此外他們還強調進一步的研究和改進仍然需要進行，以確保這種技術能夠廣泛應用於不同型別的語言模型。

展望：

未來，更廣泛且強大的技術可以幫助人們更好地控制語言模型的生成內容，以使人工智慧系統能夠根據不同的需求和變化的時代背景保持動態對齊。然而這也引發了一些哲學上的問題，例如智慧系統是否應該忘記特定的知識以及我們是否有資格更改或刪除文化作品中的內容。這些議題需要進一步的研究和討論，以確保人工智慧技術的負面影響最小化，並保護使用者和版權持有人的權益。

資料來源：

- [原文標題]：New Microsoft Research shows erasing Harry Potter from LLMs is possible with 1 GPU hour of finetuning

- [原文作者]：Kyle Wiggers

- [原文出處]：VentureBeat

- [網址]：https://venturebeat.com/2022/02/18/new-microsoft-research-shows-erasing-harry-potter-from-llms-is-possible-with-1-gpu-hour-of-finetuning/

- [日期]：2022 年 2 月 18 日

市場觀察

AIGC

Web 3

專案故事

網路議題

產品管理

專案管理

閱讀心得

職涯觀點

日常生活

專案工具

資料收集

一項研究者利用《哈利波特》令人工智慧忘記受版權保護的資料

文章目錄

人工智慧語言模型擬人化的未來：新技術實現忘卻資訊的嘗試

摘要：

背景：

技術細節：

研究結果：

討論：

展望：

資料來源：

延伸閱讀

購買電動車的消費者很快就能在購買時獲得 7500 美元的稅收抵免

2023 年 10 月，最熱鬧的月份就在這裡！｜Kaser Focus

程宇肖