
機器學習的安全工程
引言
自動駕駛汽車、電力系統等機器學習技術的應用,令機器學習在高度複雜、安全至關重要的自主系統領域引起了廣泛關注。然而在這些應用中,機器學習需要在真實情境中進行學習,而這種學習可能帶來安全風險。一篇發表在 IEEE Transactions on Automatic Control 期刊上的新研究文章提出了一種新的方法,以確保機器在學習過程中完全可信地學會安全行動,同時管理好最優解、危險情況和快速識別不安全行動之間的平衡。
學習安全行動的挑戰
該研究團隊由匹茲堡大學電氣和計算機工程系的副教授 Juan Andres Bazerque 和約翰霍普金斯大學的副教授 Enrique Mallada 領導。他們表示:“機器學習通常尋找最優解,但這可能在學習過程中產生更多錯誤。當錯誤可能導致撞上牆壁時,這就成為問題。”
這項研究表明,學習安全策略與學習最優策略在基本上是不同的,可以單獨且高效地進行。為了證實這一理論,該研究團隊在兩種不同的場景下進行了研究。透過對探索的合理假設,他們創造了一個算法,可以在有限的回合數內檢測到所有的不安全行動。該團隊還解決了在一種具有幾乎確保性約束的馬可夫決策過程(MDP)中尋找最優策略的挑戰。根據他們的分析,確保了在底層 MDP 中檢測不安全行動所需的時間和暴露於不安全事件的程度之間的權衡。
理論發現的取證
為了取證他們的理論結果,研究人員進行了一系列模擬,確認了確保的權衡。這些研究結果還表明,將安全約束納入學習過程可以加快學習的速度。
Bazerque 教授指出:“這項研究挑戰了認為學習安全行動需要進行無限次試驗的既有觀點。我們的結果表明,透過有效地管理最優解、暴露於不安全事件的程度和檢測時間之間的權衡,我們可以實現確保的安全性,而無需進行無窮多次的探索。這對機器人技術、自主系統和人工智慧等領域具有重大意義。”
總結與展望
這項研究揭示了學習安全行動與學習最優行動的本質差異,提出了一種新的方法來確保機器學習的安全性。該研究為自主系統領域提供了重要的指導,特別是在機器學習在真實情境中進行學習且安全質疑風險尤為突出的情況下。
未來,隨著機器學習技術的持續發展,保障機器學習的安全性將成為一個重要的課題。這項研究結果為解決這一課題提供了一個重要的方向,需要在實際應用中進一步取證和最佳化。
建議和結語
對於機器學習技術的開發者和應用者而言,保障學習過程中的安全性至關重要。他們應該在學習的過程中,注重平衡最優解、危險情況檢測和快速識別不安全行動之間的關係,以確保機器能夠在未知環境中學會安全行動。
此外應該鼓勵學術界和業界加固合作,共同解決機器學習安全的挑戰。這樣的合作可以促進學術研究成果得到更好的應用和落地,同時也可以提供更多實際場景下的資料取證和最佳化。
最後作為機器學習技術的應用者,我們應該在使用這些技術時謹慎行動。學習安全行動的研究結果為我們提供了更多保障,但我們仍應該注意到機器學習在實際應用中可能產生的風險和挑戰,並採取相應的預防和應對策略。只有這樣,我們才能在機器學習的發展中實現更大的突破,帶來更深遠的社會影響。
原始資訊來源:https://techxplore.com/news/2023-06-safer-machine.html