AI 模型注定只能出現幻覺？

人工智慧模型是否注定會產生幻覺？背景大型語言模型（LLM），例如 OpenAI 的 ChatGPT，都存在同樣的問題：它們編造內容。這些錯誤的內容可能是奇怪和無害的，例如聲稱金門大橋在 2016 年被搬到埃及。也可能是非常有問題乃至危險的，例如 ChatGPT 錯誤地聲稱一名澳大利亞市長在一起重大受 .... (往下繼續閱讀)

by 程宇肖
2023/9/4
8 分鐘閱讀時間

A- A A+

文章目錄

人工智慧模型是否注定會產生幻覺？

背景

大型語言模型（LLM），例如 OpenAI 的 ChatGPT，都存在同樣的問題：它們編造內容。這些錯誤的內容可能是奇怪和無害的，例如聲稱金門大橋在 2016 年被搬到埃及。也可能是非常有問題乃至危險的，例如 ChatGPT 錯誤地聲稱一名澳大利亞市長在一起重大受賄醜聞中認罪。研究人員發現，這種幻覺現象可以被利用來向毫不知情的軟體開發者分發惡意程式碼軟體包。此外 LLM 經常給出錯誤的心理健康和醫療建議，例如聲稱喝酒可以“預防癌症”。這種編造“事實”的傾向被稱爲幻覺現象，這是因爲當今的 LLM 以及所有生成型 AI 模型的開發和訓練方式造成的。

訓練模型

生成型 AI 模型並不具備真正的智慧，它們只是一種統計系統，用於預測文字、圖片、語音、音樂或其他資料。透過給模型提供大量的示例資料，通常是從公共網路獲取的，AI 模型可以根據模式來學習資料發生的機率，包括周圍資料的上下文。例如，對於一個典型的以“期待中…”結束的電子郵件片段，LLM 可能會繼續補全爲“…期待回復”，這是根據訓練資料中無數封電子郵件的模式來進行的。這並不意味着 LLM 確實期待着某件事。

幻覺現象

LLM 可能生成語法正確但不合理的內容，例如關於金門大橋的那個陳述。它們也可能說出謊言，傳播訓練資料中的不準確訊息。它們可能混合不同的訊息源，包括虛構的訊息源，即使這些訊息源明顯相互矛盾。這並不是 LLM 有惡意，它們沒有惡意，而對於它們來說真實和虛假的概念是毫無意義的。它們只是學會了將某些詞語或短語與特定概念聯系起來，即使這些聯系並不準確。“‘幻覺’與 LLM 無法估計自身預測的不確保性有關，”倫敦瑪麗皇後大學的博士研究員塞巴斯蒂安·伯恩斯說道。“通常情況下，LLM 被訓練總是產生輸出，即使輸入與訓練資料非常不同。標準 LLM 無法知道自己是否能夠可靠地回答問題或進行預測。”

解決幻覺現象

問題是，幻覺現象能夠解決嗎？這取決於對“解決”一詞的理解。Allen 人工智慧研究所的應用研究員兼工程師 Vu Ha 表示 LLM“現在和將來都會產生幻覺”。但他還相信，根據 LLM 的訓練和部署方式，有具體的方法可以減少幻覺，盡管無法完全消除。“考慮一個問答系統，”Ha 透過電子郵件說。“透過精心構建一個高質量的問題和答案知識庫，並將該知識庫與 LLM 存取起來，透過一種檢索過程提供準確的答案，可以設計它以確保高準確性。” Ha 透過對比基於微軟 LLM 技術的 Bing Chat 和基於 Google 的 Bard 對“Toolformer 論文的作者是誰？”的回答來說明擁有“高質量”知識庫的 LLM 與沒有經過仔細資料整理的 LLM 之間的區別。Bing Chat 正確列出了 Meta 的所有八位共同作者，而 Bard 錯誤地將論文歸屬爲 Google 和 Hugging Face 的研究人員。“任何部署的基於 LLM 的系統都會產生幻覺。真正的問題在於，幻覺造成的負面影響是否超過了其所帶來的好處。” Ha 說。換句話說，如果模型沒有明顯的錯誤或負面影響，偶爾錯一個日期或名字，但在其他方面很有幫助，那麼可能值得權衡。“這是一個關於最大化人工智慧預期效用的問題。”他補充道。

替代理念

如果幻覺無法解決，至少在當前的 LLM 中無法解決，那是不是一件壞事呢？伯恩斯實際上並不這麼認爲。他提出，幻覺模型可能會激發創造力，充當一種“合作創作夥伴”，提供的輸出可能不完全準確，但其中包含一些有用的線索。“‘幻覺’只在生成的陳述在事實上不正確或違反人類、社會或特定文化價值時才是問題，這在某人依靠 LLM 作爲專家時會出現，”他說。“但在創造性或藝術性任務中，能夠提供出預料之外的輸出是有價值的。人類接收者可能會對問題的回答感到驚訝，從而被引導思考某個方向，這可能會導致新的思維存取。”哈認爲，當前對 LLM 的要求可能過高，畢竟人類也會“幻覺”，例如我們在記憶錯誤或以其他方式歪曲事實時。“簡而言之，LLM 就像任何其他 AI 技術一樣，並不完美，因此會犯錯誤，”他說。“傳統上，我們接受 AI 系統犯錯，因爲我們預計和接受存在不完美。但當 LLM 犯錯時，這個問題就更加復雜了。”事實上解決幻覺的答案很可能不在技術層面的生成型 AI 模型如何工作上。眼光懷疑地看待模型的預測似乎是最好的方法。關鍵詞：幻覺、人工智慧、模型

Illusion-人工智慧,模型,幻覺

產品管理

專案管理

Web 3

AIGC

專案故事

專案工具

網路議題

閱讀心得

軟體測試

程式筆記

職涯觀點

日常生活

市場觀察

資料收集