網路議題

研究發現:深度神經網路和我們的視覺方式不同

深度神經網路的知覺差異:模型與人類的認知概觀最新的一項研究指出,深度神經網路對於特定的影象或單詞的反應並不總是與人類感知保持一致。當這些神經網路試圖生成一個與給定的自然輸入(例如一張熊的圖片)產生相同反應的影象或聲音時,大多數生成的結果對於人類觀察者來說是無法辨識的。這表明這些模型在對待具有截然不同 .... (往下繼續閱讀)

分享到 Facebook 分享到 Line 分享到 Twitter

文章目錄

研究發現:深度神經網路和我們的視覺方式不同

深度神經網路的知覺差異:模型與人類的認知

概觀 最新的一項研究指出,深度神經網路對於特定的影象或單詞的反應並不總是與人類感知保持一致。當這些神經網路試圖生成一個與給定的自然輸入(例如一張熊的圖片)產生相同反應的影象或聲音時,大多數生成的結果對於人類觀察者來說是無法辨識的。這表明這些模型在對待具有截然不同特徵的刺激時建立了自己的「不變性」。本研究為研究人員提供了一種評估這些模型如何模擬人類感知組織的新方法。

背景 深度神經網路是一種計算模型,可以透過訓練來識別影象或聲音,並學習將它們分類為特定的類別,即使影象的顏色不同,聲音的音調也不同。這些模型被認為是生物感知系統的領先模型。 研究人員認為,人類感知系統能夠對待具有核心身份的物件不受非關鍵特徵影響,如光線強度或觀察角度。這種對待在認知科學中被稱為「不變性」,即不同的刺激表現出差異時仍被認為是相同的物體。

研究目的 研究人員想知道,訓練用於執行分類任務的深度神經網路是否會產生類似的不變性。為了回答這個問題,他們使用這些模型生成與研究人員提供的示例刺激產生相同反應的刺激,並稱之為「模型變體」。這種方法是傳統感知研究中的一種診斷方法,用於描述當一個系統無法區分不同光的波長時看起來相同的顏色。

研究結果 令人驚訝的是,研究人員發現,大多數以這種方式生成的影象和聲音看起來和聽起來並不像最初給定的示例。這些影象多數是看起來亂七八糟的畫素,聲音則類似於無法理解的噪音。當研究人員將這些影象展示給人類觀察者時,大多數情況下,人類無法將這些模型合成的影象類別化為與原始目標示例相同的類別。 研究結果表明,這些模型已經建立了與人類認知系統中不同的不變性。這使得模型在對待一對截然不同的刺激時將其視為相同,這一點不同於人類的感知。

模型特定的不變性 研究人員在許多不同的視覺和聽覺模型中觀察到了相同的效果。然而每個模型都似乎發展出自己獨特的不變性。當一個模型的變體展示給另一個模型時,這些變體對第二個模型和人類觀察者來說都是無法辨識的。 研究人員還發現,他們可以透過對抗訓練的方法使模型合成的影象對人類觀察者更容易識別。這種方法最初是為理解決物體識別模型的另一個局限性:引入微小、幾乎不可察覺的影象變化可能導致模型出錯識別。 然而研究人員發現,這種對抗訓練方法對模型的影響超出了抵抗對抗性攻擊的效果。這種改進似乎獨立於訓練對模型抵抗對抗性攻擊的影響。

結論和建議 透過分析計算模型生成的變體,研究人員可以評估該模型模擬人類感知系統的組織方式有多接近。這是一種行為測試,可以用於檢測模型和人類觀察者之間的不變性是否相同。 此外這種分析還可以用於評估給定模型中不變性的特異性,這有助於發現未來改進模型的潛在方法。 這項研究的發現為理解深度神經網路如何處理刺激提供了新的洞察。此外這也提醒我們在設計和評估人工智慧模型時需要更加謹慎和小心。為了確保模型的可靠性和有效性,我們應該更深入地考慮玻璃箱效應、模型的偏差和局限性以及模型與人類感知的差異。 這項研究還有一些未解之謎,其中之一是為什麼對抗訓練可以使模型產生更容易識別的變體。這是一個值得未來研究努力解答的問題。

參考資料 - Trafton, A. (2023). Study: Deep neural networks don't see the world the way we do. Retrieved from https://techxplore.com/news/2023-10-deep-neural-networks-dont-world.html

NeuralNetworks-深度學習、神經網路、視覺處理、人工智慧、機器學習
江塵

江塵

Reporter

大家好!我是江塵,一名熱愛科技的發展和創新,我一直都保持著濃厚的興趣和追求。在這個瞬息萬變的數位時代,科技已經深入到我們生活的方方面面,影響著我們的工作、學習和娛樂方式。因此,我希望透過我的部落格,與大家分享最新的科技資訊、趨勢和創新應用。