AI 機器人的「GPT 時刻」即將到來
專家觀點
由於基礎模型已在數位世界中改變了人工智慧,所以無人不知。大型語言模型(LLMs)如 ChatGPT、LLaMA 和 Bard 已經在語言領域革命性地改變了人工智慧。而 OpenAI 的 GPT 模型雖不是唯一的大型語言模型,卻因為在文字和影象輸入方面能產生人類般的回應而獲得了主流認可,甚至在某些需要複雜問題解決和高階推理的任務上也能做到。
人工智慧的關鍵革命
擁有能夠學習如何與物理世界互動的 AI 機器人將增強各個領域中的重複性工作,從物流、運輸和製造到零售、農業,甚至醫療等範疇。這也將解鎖在數位世界中幾十年來見到的各種效率,而現今擁有相似的潛在價值在物理世界中實現。
基礎模型方法
GPT 是在龐大多後設資料集上訓練的 AI 模型。過去,工程師會收集資料來訓練特定問題的特定 AI。然後,為理解決其他問題,他們又需要收集新資料。現在則相反,以基礎模型方法,一個通用模型就能被普遍應用。且這一個非常通用的模型的表現比每個特定模型還要優秀。它在一個特定任務上的表現更好,能從其他任務中獲得經驗並通用於新任務,此模型因此不斷提升。
大型專有高質量資料集的訓練
要擁有通用 AI,首先需要存取龐大多元的資料。OpenAI 已經相對有效地取得了訓練 GPT 模型所需的現實世界資料。GPT 已經在從整個網際網路收集的大型多樣資料集上進行了訓練,包括圖書、新聞文章、社交媒體帖子、程式碼等。然而僅僅擁有資料集的大小是不夠的;高質量、高價值資料的提煉也扮演著極其重要的角色。
強化學習的作用
OpenAI 運用透過人類反饋的強化學習來使模型的回答與人類偏好(例如,對使用者有益的內容)保持一致。因為單純的監督學習僅能處理明確模式或示例集合,而言語模型需要在沒有唯一正確答案的目標下解決問題。
建議與展望
在過去幾年裡,全球一些最優秀的 AI 和機器人專家為機器人基礎模型的技術和商業根基奠定了基礎。GPT 類似的 AI 模型已經類似地在構建,但實現物理世界的人類級自主權是另一個科學挑戰,這將重新定義人工智慧的未來。
挑戰性、迅猛的增長即將到來
擁有通用 AI 對於各種現實世界設定有著一系列複雜的物理要求。AI 必須適應不同的硬體應用,而跨不同行業(物流、運輸、製造、零售、農業、醫療等)和各行業活動間也不太可能會使用同一款硬體。
倉庫和分銷中心是物理世界中 AI 模型的理想學習環境。在這些場所,可能有數十萬甚至上百萬不同的庫存(SKU)在任何時刻在設施中流動,這提供了訓練「GPT for robotics」所需的大型私有高質量資料集。
結論
AI 機器人的“GPT 時刻”即將到來。機器人基礎模型的增長軌跡正以極快的速度加速,特別是在需要精密物體操作的任務中,它們已經在現實生產環境中使用,我們將在 2024 年看到大量商業化的機器人應用被大規模部署。