AIGC

未來 AI 聊天機器人即將變得更加專業化，而非像 ChatGPT 那樣普適。

未來，AI 聊天機器人將趨於專業化簡介 AI 技術正在以驚人的速度發展，ChatGPT 已成為有史以來增長最快的線上服務。Google 和 Microsoft 正在將生成式 AI 整合到其產品中，世界各國領導人也迫不及待地將 AI 作為經濟增長的工具。隨著我們超越 ChatGPT 和 Bard，我們很 .... (往下繼續閱讀)

by 程宇肖
2023/9/22
8 分鐘閱讀時間

A- A A+

文章目錄

未來，AI 聊天機器人將趨於專業化

簡介

AI 技術正在以驚人的速度發展，ChatGPT 已成為有史以來增長最快的線上服務。Google 和 Microsoft 正在將生成式 AI 整合到其產品中，世界各國領導人也迫不及待地將 AI 作為經濟增長的工具。隨著我們超越 ChatGPT 和 Bard，我們很可能會看到 AI 聊天機器人越來越少地是通用的，而是更加專業化。

資料的價值

在這個發展過程中，資料的價值將是一個重要因素。大型語言模型（LLMs）是 ChatGPT 等 AI 的核心技術，而建立這些模型所需的訓練資料成本不斷增加。公司們知道資料的價值：Meta 和 Google 透過出售基於使用者資料的廣告獲得數十億美元。然而資料的價值正在發生變化。Meta 和 Google 銷售的是資料“洞察”，它們投資於分析，將許多資料點轉化為對使用者的預測。對於 ChatGPT 的開發者 OpenAI 來說資料的價值有些微妙的不同。對於 OpenAI 來說這些資料實際上是一種構建類似人類語言的 AI 模型的寶貴資源。單獨一條推特不能教會 AI 構造句子，但數十億條推特、部落格文章、維基百科條目等確實能。OpenAI 建立的先進 LLM GPT-4 可能就是使用來自 X(前稱 Twitter)、Reddit、維基百科等的大量資料進行訓練的。因此 AI 革命正在改變資料豐富的組織的商業模式。

合成資料的解決方案

在獲取資料的過程中，OpenAI 等組織面臨著越來越高的費用。這個問題的解決方案之一可能是合成資料。合成資料是由 AI 系統從頭生成的，以訓練更先進的 AI 系統，從而提高它們的效能。合成資料被設計成執行與真實訓練資料相同的任務，但由 AI 生成。這是一個新的想法，但也面臨多個問題。好的合成資料需要與基於其基礎資料的原始資料有足夠的差異，以告訴模型一些新的訊息，同時又足夠相似，以告訴它一些準確的訊息。這可能很難實現。如果合成資料只是真實世界資料的逼真複製，生成的 AI 模型可能在創造力方面遇到困難，並強化現有的偏見。另一個問題是“哈布斯堡 AI”問題。它指的是將 AI 訓練在合成資料上將導致這些系統的效能下降，這就像哈布斯堡王族的近親繁殖一樣。一些研究表明，ChatGPT 等系統已經出現了這個問題。ChatGPT 之所以如此好，是因為它使用了人類反饋的強化學習（RLHF），人們對其輸出進行了準確性評分。如果由 AI 生成的合成資料存在不準確性，那麼基於這些資料訓練的 AI 模型本身就會不準確。因此糾正這些不準確性的需求可能會增加。然而大多數人可能能夠判斷一個句子是否在語法上是正確的，但能夠評論其事實的準確性的人可能較少，特別是當輸出是技術或專業領域時。專業領域的不準確輸出不太可能被 RLHF 發現。如果合成資料意味著存在更多的不準確性需要發現，通用型 LLM 的質量可能會停滯或下降，即使這些模型“學到”更多。

小型語言模型

以上問題解釋了 AI 中出現的一些新趨勢。Google 的工程師已經透露，沒有什麼阻止第三方重建像 GPT-3 或 Google 的 LaMDA 等大型語言模型。許多組織可能會為了自身的目標，使用自己的專業資料構建自己內部的 AI 系統，這對於這些組織來說可能會更有價值，比起通用的 ChatGPT。最近，日本政府指出，開發一個以日本為中心的 ChatGPT 版本對於他們的 AI 戰略可能是值得的，因為 ChatGPT 不足以代表日本。軟體公司 SAP 最近推出了其 AI“路線圖”，以為專業組織提供 AI 開發能力。這將使公司更容易構建他們自己的定制版 ChatGPT。麥肯錫和畢馬威等諮詢公司正在探索“特定目的”的 AI 模型培訓。有關如何建立私有的 ChatGPT 的指南可以在網上輕易找到。GPT4All 等開源系統已經存在，隨著通用型 LLM 的開發挑戰和潛在的監管障礙增加，AI 的未來可能是許多特定的小型語言模型，而不是大型語言模型。小型語言模型可能在受到的資料較少時效果不佳，但它們在 RLHF 方面可能具有優勢，因為小型語言模型可能會被開發用於特定目的。對於那些對其組織及其目標有專業知識的員工來說他們提供給這些 AI 系統的反饋可能比通用 AI 系統的通用反饋更有價值。這可能克服了資料較少的缺點。綜上所述，未來，我們很可能會看到越來越少的 ChatGPT 等通用 AI 聊天機器人，而更多的是針對特定需求的專業化機器人。隨著 AI 的發展，合成資料可能成為解決資料成本增加的一種解決方案，但同時也面臨著一些挑戰。小型語言模型可能成為未來 AI 的一個關鍵方向，因為它們可以根據特定目的和專業領域開發，並利用專業反饋來提高效能。雖然小型語言模型可能在資料量較少的情況下表現不佳，但專業反饋的優勢可能彌補了這一不足。

AI,Chatbot,Professional,Specialization,Future-AI 聊天機器人,專業化,ChatGPT

產品管理

專案管理

Web 3

AIGC

專案故事

專案工具

網路議題

閱讀心得

軟體測試

程式筆記

職涯觀點

日常生活

市場觀察

資料收集

未來 AI 聊天機器人即將變得更加專業化，而非像 ChatGPT 那樣普適。

文章目錄

未來，AI 聊天機器人將趨於專業化

簡介

資料的價值

合成資料的解決方案

小型語言模型

延伸閱讀

波蘭根據 GDPR 投訴，對 ChatGPT 展開隱私調查

生成式人工智慧的著作權問題仍然無法消失

程宇肖