AIGC

未來 AI 聊天機器人即將變得更加專業化,而非像 ChatGPT 那樣普適。

未來,AI 聊天機器人將趨於專業化簡介 AI 技術正在以驚人的速度發展,ChatGPT 已成為有史以來增長最快的線上服務。Google 和 Microsoft 正在將生成式 AI 整合到其產品中,世界各國領導人也迫不及待地將 AI 作為經濟增長的工具。隨著我們超越 ChatGPT 和 Bard,我們很 .... (往下繼續閱讀)

分享到 Facebook 分享到 Line 分享到 Twitter

文章目錄

未來 AI 聊天機器人即將變得更加專業化,而非像 ChatGPT 那樣普適。

未來,AI 聊天機器人將趨於專業化

簡介

AI 技術正在以驚人的速度發展,ChatGPT 已成為有史以來增長最快的線上服務。Google 和 Microsoft 正在將生成式 AI 整合到其產品中,世界各國領導人也迫不及待地將 AI 作為經濟增長的工具。隨著我們超越 ChatGPT 和 Bard,我們很可能會看到 AI 聊天機器人越來越少地是通用的,而是更加專業化。

資料的價值

在這個發展過程中,資料的價值將是一個重要因素。大型語言模型(LLMs)是 ChatGPT 等 AI 的核心技術,而建立這些模型所需的訓練資料成本不斷增加。公司們知道資料的價值:Meta 和 Google 透過出售基於使用者資料的廣告獲得數十億美元。然而資料的價值正在發生變化。Meta 和 Google 銷售的是資料“洞察”,它們投資於分析,將許多資料點轉化為對使用者的預測。對於 ChatGPT 的開發者 OpenAI 來說資料的價值有些微妙的不同。對於 OpenAI 來說這些資料實際上是一種構建類似人類語言的 AI 模型的寶貴資源。單獨一條推特不能教會 AI 構造句子,但數十億條推特、部落格文章、維基百科條目等確實能。OpenAI 建立的先進 LLM GPT-4 可能就是使用來自 X(前稱 Twitter)、Reddit、維基百科等的大量資料進行訓練的。因此 AI 革命正在改變資料豐富的組織的商業模式。

合成資料的解決方案

在獲取資料的過程中,OpenAI 等組織面臨著越來越高的費用。這個問題的解決方案之一可能是合成資料。合成資料是由 AI 系統從頭生成的,以訓練更先進的 AI 系統,從而提高它們的效能。合成資料被設計成執行與真實訓練資料相同的任務,但由 AI 生成。這是一個新的想法,但也面臨多個問題。好的合成資料需要與基於其基礎資料的原始資料有足夠的差異,以告訴模型一些新的訊息,同時又足夠相似,以告訴它一些準確的訊息。這可能很難實現。如果合成資料只是真實世界資料的逼真複製,生成的 AI 模型可能在創造力方面遇到困難,並強化現有的偏見。另一個問題是“哈布斯堡 AI”問題。它指的是將 AI 訓練在合成資料上將導致這些系統的效能下降,這就像哈布斯堡王族的近親繁殖一樣。一些研究表明,ChatGPT 等系統已經出現了這個問題。ChatGPT 之所以如此好,是因為它使用了人類反饋的強化學習(RLHF),人們對其輸出進行了準確性評分。如果由 AI 生成的合成資料存在不準確性,那麼基於這些資料訓練的 AI 模型本身就會不準確。因此糾正這些不準確性的需求可能會增加。然而大多數人可能能夠判斷一個句子是否在語法上是正確的,但能夠評論其事實的準確性的人可能較少,特別是當輸出是技術或專業領域時。專業領域的不準確輸出不太可能被 RLHF 發現。如果合成資料意味著存在更多的不準確性需要發現,通用型 LLM 的質量可能會停滯或下降,即使這些模型“學到”更多。

小型語言模型

以上問題解釋了 AI 中出現的一些新趨勢。Google 的工程師已經透露,沒有什麼阻止第三方重建像 GPT-3 或 Google 的 LaMDA 等大型語言模型。許多組織可能會為了自身的目標,使用自己的專業資料構建自己內部的 AI 系統,這對於這些組織來說可能會更有價值,比起通用的 ChatGPT。最近,日本政府指出,開發一個以日本為中心的 ChatGPT 版本對於他們的 AI 戰略可能是值得的,因為 ChatGPT 不足以代表日本。軟體公司 SAP 最近推出了其 AI“路線圖”,以為專業組織提供 AI 開發能力。這將使公司更容易構建他們自己的定制版 ChatGPT。麥肯錫和畢馬威等諮詢公司正在探索“特定目的”的 AI 模型培訓。有關如何建立私有的 ChatGPT 的指南可以在網上輕易找到。GPT4All 等開源系統已經存在,隨著通用型 LLM 的開發挑戰和潛在的監管障礙增加,AI 的未來可能是許多特定的小型語言模型,而不是大型語言模型。小型語言模型可能在受到的資料較少時效果不佳,但它們在 RLHF 方面可能具有優勢,因為小型語言模型可能會被開發用於特定目的。對於那些對其組織及其目標有專業知識的員工來說他們提供給這些 AI 系統的反饋可能比通用 AI 系統的通用反饋更有價值。這可能克服了資料較少的缺點。 綜上所述,未來,我們很可能會看到越來越少的 ChatGPT 等通用 AI 聊天機器人,而更多的是針對特定需求的專業化機器人。隨著 AI 的發展,合成資料可能成為解決資料成本增加的一種解決方案,但同時也面臨著一些挑戰。小型語言模型可能成為未來 AI 的一個關鍵方向,因為它們可以根據特定目的和專業領域開發,並利用專業反饋來提高效能。雖然小型語言模型可能在資料量較少的情況下表現不佳,但專業反饋的優勢可能彌補了這一不足。
AI,Chatbot,Professional,Specialization,Future-AI 聊天機器人,專業化,ChatGPT
程宇肖

程宇肖

Reporter

大家好!我是程宇肖,我對於科技的發展和應用有著濃厚的興趣,並致力於將最新的科技趨勢和創新帶給大家。科技領域的變化速度驚人,每天都有令人興奮的新發現和突破。作為一名部落格作者,我將帶領大家深入探索科技的奧秘和應用的無限可能。