資料科學家預測股票回報的 AI 和線上新聞
專家評論
作者:愛德華·費爾森塔爾()
引言
資料科學和人工智慧技術的快速發展正在改變各個行業,其中包括金融領域。一項最新研究由康奈爾大學的研究人員開展,他們利用機器學習、自然語言處理和金融學等跨學科領域的知識,提出一種新的可解釋的機器學習框架,該框架應用了新聞資料預測金融回報,其預測精確度超過了傳統模型。
新的模型
過去,機器學習模型常常因為缺乏可解釋性而受到批評。研究人員利用金融新聞資料建立了一個可解釋的機器學習模型,並將其應用於股票和行業特定的訊息,以比傳統模型更準確地預測金融回報。
該模型利用自然語言處理的方法來處理金融新聞資料,將其轉化為對應的數位表示。研究人員設計了定制的算法來處理數位資料,並從中提取關鍵訊息。這種方法不需要情感分析,而是利用新聞資料作為指導,找出與特定股票或行業相關的關鍵詞或資產,從而揭示更多的股票和行業特定訊息。
兩個模型的應用
研究人員分別開發了兩個不同的模型:News Embedding UMAP Sparse Selection(NEUSS)模型和 News Sparse Encoder with Rationale(INSER)模型。
NEUSS 模型用於預測單個股票的回報,而 INSER 模型則用於識別每個行業的重要詞語,並將其應用於更準確地預測行業回報。
這些模型的靈活性和可解釋性使其在預測金融回報方面表現出色。NEUSS 模型的準確度超過了傳統的預測基準(Fama-French 5-factor 模型)50%,而 INSER 模型(不使用行業特定訊息)的準確度超過了基準 10%。
思考
這項研究引發了對機器學習、自然語言處理和金融領域的思考。它提供了一種新的方法,展示了機器學習如何透過利用大量的新聞資料來預測金融回報。同時它也引發了對機器學習模型可解釋性的討論。
傳統的機器學習模型往往被認為是黑盒子,難以理解和解釋。而這項研究提出的模型則提供了一種可解釋的方法,使研究人員能夠清楚地看到模型的重要特徵。這種可解釋性對於投資者和金融從業者來說非常重要,因為他們需要理解模型的執行原理,以做出更明智的投資決策。
然而這項研究也引發了一些哲學問題。機器學習模型透過分析大量的新聞資料來預測金融回報,這涉及到對新聞資料的處理和使用。例如,該模型如何處理來自不同新聞來源的訊息?它如何解決新聞資料的可靠性和主觀性問題?這些問題都需要仔細思考和討論。
編輯評論
這項研究將機器學習和自然語言處理應用於金融領域,為投資者提供了一個新的預測工具。它的可解釋性和準確性使其成為一個有價值的資源,可以用於指導投資決策。
然而投資者應該謹慎使用這種預測模型。儘管這項研究表明,新聞資料可以提供有價值的訊息,但它不能替代對基本面和市場情況的全面分析。投資者應該將這種模型作為一種參考,而不是唯一的依據。
此外投資者還應關注模型的局限性。該模型是基於過去的資料進行預測,無法準確預測未來的市場變化。投資者應該保持謹慎態度,並使用多種方法和模型來評估和預測投資回報。
最後隨著技術的發展,金融領域的機器學習應用將變得越來越普遍。然而我們應該保持警惕,確保這些技術的應用是合法的、透明的,並符合監管標準。
總之這項研究為金融領域的預測模型帶來了新的思路和方法。它的可解釋性和準確性使其成為一個有價值的工具,但投資者應該謹慎使用並注意其局限性。