
新技術基於 18 世紀數學顯示,簡單的 AI 模型不需要深度學習
極簡 AI 模型基於古老數學
喬伊斯基的約翰內斯大學的研究人員利用 18 世紀數學的新技術,對最流行的人工智慧技術深度學習進行了簡化。他們還發現,50 年前的傳統訓練算法比最近流行的技術效果更好。這種更簡單的方法推進了綠色 IT 的發展,更易於使用和理解。
近年來人工智慧的快速發展在很大程度上依賴於一種核心技術:深度學習。深度學習是指利用大型資料集和大量計算資源進行訓練的人工智慧技術,即透過具有多個資料處理層的網路進行訓練。深度學習使得計算機能夠執行複雜的任務,如分析和生成影象和音樂,玩數位化遊戲,最近還可以作為自然語言對話代理人,提供現有知識的高質量摘要。
六年前,湯米·卡爾卡寧教授和博士研究員揚·漢寧對資料降維進行了初步研究。結果令人驚訝:如果將簡單的網路結構以新的方式結合在一起,就不需要深度。可以透過淺層模型獲得相似甚至更好的結果。卡爾卡寧說:“使用深度學習技術是一項複雜且容易出錯的工作,由此產生的模型很難進行維護和解釋。而我們的新模型在淺層形式下更具表達能力,可以可靠地降維大型資料集,同時保留其中所有必要的訊息。”
新的人工智慧技術結構可以追溯到 18 世紀的數學。卡爾卡寧和漢寧還發現,與深度學習中使用的 21 世紀技術相比,20 世紀 70 年代的傳統最佳化方法在準備模型方面更為有效。漢寧建議:“我們的研究結果確保了在各種應用中使用神經網路比以前更加容易和可靠。”
簡單模型帶來更綠色和更符合道德的 AI
人工智慧在現代技術中的作用越來越重要,因此理解 AI 如何完成其工作越來越重要。卡爾卡寧說:“AI 越透明和簡單,就越容易考慮其道德使用。”他補充說:“例如,在醫療應用中,深度學習技術非常複雜,直接使用可能會因意外的隱含行為而危及患者安全。”研究人員還指出,簡單的模型有助於發展綠色 IT,因為它們節省計算資源並且使用的能量明顯更少。
這些結果挑戰了關於深度學習技術的常見觀點和當前流行理解的信念,因此他們很難得到發表。卡爾卡寧說:“深度學習在研究、開發和人工智慧業務中具有如此重要的地位,即使科學總是前進並反映最新的證據,但是業界本身可能對改變抱有抵制心態。”他補充道:“我們非常期待這些結果在科學和商業界的反響。我們的新 AI 技術在我們自己的研究中有多種應用,包括用於可持續經濟中更好的材料的奈米技術,改善數位學習環境以及增加醫療和福祉技術的可靠性和透明度。”
相關訊息:Tommi Kärkkäinen 等人,“新增自編碼器進行維度估計”,Neurocomputing(2023)。DOI:10.1016 / j.neucom.2023.126520
關鍵詞:技術-18 世紀數學,新技術,AI 模型,深度學習
延伸閱讀
- 探索 DeepSeek:你必須理解的 AI 聊天機器人應用全指南!
- OpenAI 計劃將 Sora 影片生成器整合至 ChatGPT,開啟創意新視界!
- 「Inception 首度曝光!全新 AI 模型顛覆科技界!」
- 全方位理解 Anthropic 的 AI:揭開 Claude 的神祕面紗!
- 《Anthropic 利用寶可夢測試最新 AI 模型,成果驚人!》
- 現代新推出的特斯拉充電介面到底缺了什麼?
- 德州迎來新一波自駕計程車,Archer 獲得 3 億美元打造防禦任務!
- GoogleI/O 開發者大會即將來襲!5 月 20-21 日不容錯過的科技盛宴!
- DeepMind 的 AI 挑戰數學奧林匹克金牌選手,表現驚人!
- OpenAI 揭開 o3-mini 模型思考過程的神祕面紗!