機器學習模型即使只有有限的訓練資料也能產生可靠結果
引言
近期,劍橋大學和康奈爾大學的研究人員發現了一種能夠在現實世界的複雜方程中理解的機器學習模型的可靠性建立方法,且需要的訓練資料遠遠少於通常所期望的量。這項研究成果刊登在《美國國家科學院院刊》上,對於工程學和氣候模擬等應用領域,構建更具時間和成本效益的機器學習模型具有重要意義。背景
大多數機器學習模型在能夠準確生成結果之前需要大量的訓練資料。傳統上,人們需對一大批資料進行標注,如一組影象,以訓練模型。然而這種方法既耗時又昂貴。研究人員對於需要多少訓練資料才能訓練出可靠的模型非常感興趣。 先前的研究表明,研究人員已經能夠用少量的資料訓練機器學習模型並獲得卓越的結果,但是並沒有對此做出很好的解釋。這項研究專注於偏微分方程(PDEs),這是描述自然界中事物如何隨著時間和空間演化的一類物理方程。研究方法和結果
研究人員發現用於描述擴散的 PDEs 具有一種有助於設計人工智慧模型的結構。他們建立了一個有效的算法,利用短程和長程的相互作用來預測 PDEs 的解。這使他們能夠在模型中建立一些數學保證,並確保需要多少訓練資料才能得到穩健的模型。 研究人員表示這取決於領域,但就物理學而言,我們發現即使資料量非常有限,也能夠取得很大的進展。由於這些方程的數學性質,我們可以利用它們的結構使模型更加高效。討論與展望
這項研究的成果將使資料科學家能夠開啟許多機器學習模型的“黑盒”,並設計出可以被人類解讀的新型模型,但還需要進一步的研究。研究人員表示我們需要確保模型學習到正確的東西,但物理學的機器學習是一個令人興奮的領域,可以幫助我們解答許多有趣的數學和物理問題。總結
這項研究的發現表明,機器學習模型即使只有有限的訓練資料,也能夠產生可靠的結果。這一發現對於在工程學和氣候模擬等領域構建更高效的模型具有重要意義。然而未來仍需要更多的研究來改進這些技術。 此次研究的結果為我們提供了一個重大的洞察,即利用傳統的物理方程模型所具備的結構特徵,我們可以在資料量較少的情況下訓練出可靠的機器學習模型。這種方法有望節省時間和成本,並為我們在各個應用領域中尋找新的創新解決方案提供了可能性。參考文獻
Nicolas Boullé 等,《Elliptic PDE learning is provably data-efficient》,《美國國家科學院院刊》,2023 年,DOI: 10.1073/pnas.2303904120 提供者: 劍橋大學 引用: Machine learning models can produce reliable results even with limited training data (2023, September 19) retrieved 19 September 2023 from https://techxplore.com/news/2023-09-machine-reliable-results-limited.html關鍵詞
#MachineLearning, 機器學習, 模型訓練, 資料分析, 可靠性, 結果評估"MachineLearning"-機器學習,模型訓練,資料分析,可靠性,結果評估