網路議題

5 大方式，企業領袖如何運用大型語言模型開啟全新可能性

探索企業領袖：如何運用大型語言模型改進企業創新引言近來，生成式人工智慧（generative AI）和大型語言模型（LLMs）如 ChatGPT 已成為熱門話題，從社交媒體到新聞到日常對話，無處不在。這些技術顯示出了研究領域和商業應用的巨大潛力，可以重塑各個行業，改進人機互動的質量。透過探索這些應用 .... (往下繼續閱讀)

by 程宇肖
2023/8/20
11 分鐘閱讀時間

A- A A+

文章目錄

探索企業領袖：如何運用大型語言模型改進企業創新

引言

近來，生成式人工智慧（generative AI）和大型語言模型（LLMs）如 ChatGPT 已成為熱門話題，從社交媒體到新聞到日常對話，無處不在。這些技術顯示出了研究領域和商業應用的巨大潛力，可以重塑各個行業，改進人機互動的質量。透過探索這些應用，企業主和企業決策者可以獲得寶貴的靈感，推動加速增長，實現明顯改善的結果。

大型語言模型是一種具備數十億個引數的神經網路，透過在龐大的文字資料上訓練，能夠理解、處理和生成類似於人類語言的內容。而生成式人工智慧則是一類機器學習技術，可以建立類似於人創作的內容，包括影象、音樂和文字等。這些技術共同提供了一個多樣化的應用範疇，有潛力改變各個行業和人機互動的質量。

存取大型語言模型與外部資料

大型語言模型在一些通用任務上顯示出出色的能力，如翻譯和摘要，而無需進行初始定制。然而對於特定領域的任務，例如提供關於公司年報的答案，這種能力可能無法順暢擴充套件。這就是檢索增強生成（Retrieval Augmented Generation，RAG）技術的用武之地。RAG 是一種利用外部資料源建立基於大型語言模型的系統的方法。RAG 使語言模型可以透過結合自然語言處理能力和外部知識提供更好的答案。

RAG 透過從外部知識源（如大規模檔案集、資料庫或網際網路）中檢索相關訊息，並將這些訊息與之前的提示一起傳遞給大型語言模型，以產生更多訊息的、具有上下文聯動性和準確性的回答。這種方法使語言模型更具多功能性和用途，包括問答、內容創作和實時資料互動對話。

許多企業和應用已經開始使用類似的技術。例如，Podurama 這個播客應用使用了類似的技術來建立其基於人工智慧的推薦聊天機器人。這些機器人能夠根據使用者的查詢熟練地推薦相關節目，並從播客的文字記錄中獲取洞察，以改進推薦結果的準確性。

使用 RAG 技術還可以在危機管理方面發揮重要作用。PagerDuty 是一個 SaaS 事故響應平臺，利用大型語言模型生成事故摘要，並透過內部 Slack 資料對其進行補充，從而提高摘要的質量。

存取大型語言模型與外部應用

除了使用外部資料源，大型語言模型還可以與特定任務的外部應用程式進行存取。這在模型因內部知識訊息過時而導致不準確性的情況下尤為重要。例如，在詢問英國現任首相時，ChatGPT 可能仍然會提到已經離任的鮑裏斯·約翰遜。為理解決這些挑戰，可以透過代理機制將大型語言模型與外界應用相結合。

一個明顯的例子是 Expedia 的聊天機器人，它可以引導使用者發現和預訂酒店，回答有關住宿的問題，並提供個性化的旅遊建議。這款聊天機器人能夠與天氣 API（用於即時天氣資料）或 SerpAPI（用於網路搜尋）等工具進行互動。

另一個有趣的應用是實時對推文進行特定屬性的標記，如情緒、侵略性和語言等。對於市場銷售和廣告來說存取到電子商務工具的代理應用可以幫助大型語言模型根據使用者的興趣和內容推薦產品或套餐。

串聯大型語言模型

通常情況下，大型語言模型單獨運用於大多數應用。然而最近，串聯多個大型語言模型在處理複雜任務方面越來越受到關注。它涉及將多個大型語言模型存取在一起，以執行更加複雜的任務。每個大型語言模型專注於特定方面，它們共同生成全面和精煉的輸出。

這種方法已經應用於語言翻譯，其中大型語言模型被連續使用來將文字從一種語言轉換為另一種語言。如微軟公司所提出的，在資源有限的語言翻譯服務中，使用這種方法可以實現更準確和上下文感知的罕見詞的翻譯。

對消費者型公司而言，串聯大型語言模型可以建立動態客戶支援體驗，從而增強客戶互動、服務質量和運營效率。例如，第一個大型語言模型可以對客戶的詢問進行分類，然後將其傳遞給專門的大型語言模型以獲得更準確的回答。在製造業中，可以使用串聯的大型語言模型來最佳化從頭到尾的供應鏈流程，使用專門的大型語言模型進行需求預測、庫存管理、供應商選擇和風險評估等。

利用大型語言模型進行實體提取

在大型語言模型出現之前，實體提取需要使用勞動密集型的機器學習方法，包括資料收集、標註和複雜的模型訓練。這一過程繁瑣且資源密集。然而有了大型語言模型，進行實體提取變得簡單多了。只需要簡單的提示，使用者就可以輕鬆地從模型中查詢文字中的實體。有趣的是，當從 PDF 等非結構化文字中提取實體時，您甚至可以在提示中定義模式和興趣屬性。

例如，金融機構可以利用大型語言模型從新聞文章中提取關鍵的金融實體，如公司名稱、程式碼和財務資料，以實現及時和準確的市場分析。同樣地，廣告/銷售機構可以利用大型語言模型進行實體提取，將廣告指令碼、演員、地點和日期等分類，從而實現高效率的內容索引和資產再利用。

透過 ReAct 提示提高大型語言模型的透明度

雖然從大型語言模型獲得直接回答無疑是有價值的，但黑盒方法的不透明性常常引起使用者的疑慮。此外面對複雜查詢的不準確回答，很難準確指出失敗的具體步驟，這可能導致疑慮。ReAct 框架提供了一種解決方案，可以增強大型語言模型的透明度。

ReAct 框架重點在於逐步推理，使大型語言模型像人類一樣生成解決方案。目標是讓模型像人一樣進行思考，並使用語言解釋其推理過程。這種方法的操作過程非常簡單，只需人工標註者在自然語言表達中表達其思路和相應的行動即可。借鑒這種方法，許多教育科技公司正在試驗工具，為學生提供個性化輔助，如課程和作業指導。這樣的工具可以幫助學生獨立理解概念，避免抄襲，並獲得更好的學習成效。

結論

雖然人工智慧是否能夠取代人類在各個角色上的作用以及實現技術單一性（如 AI 的教父 Geoffrey Hinton 所預測的）的問題依然存在著爭議，但有一點是確保的：大型語言模型無疑將在加速各種任務中發揮關鍵作用。它們有助於提高效率，促進創造力並最佳化決策過程，同時簡化複雜任務。對於資料科學家、軟體開發人員和產品所有者等各種技術角色的專業人士來說大型語言模型可以提供寶貴的工具，以提高工作流程的效率，獲取洞察和開拓新的可能性。

Varshita Sher 是一位資料科學家，熱衷於撰寫部落格和製作播客，並在 Haleon 領導自然語言處理和生成式人工智慧團隊。

LanguageModels-大型語言模型、企業領袖、運用方式、全新可能性、企業創新

市場觀察

AIGC

Web 3

專案故事

網路議題

產品管理

專案管理

閱讀心得

職涯觀點

日常生活

專案工具

資料收集