AIGC

Google 強化了 Vertex AI，以跟上生成式人工智慧的熱潮

Google 升級 Vertex AI 以追趕生成式人工智慧熱潮背景最近由《財富》和 Deloitte 聯合進行的一項調查發現，全球超過一半的 CEO 正在進行 AI 的實驗，以生成文字、影象和其他形式的資料。同時麥肯錫的一份報告顯示，三分之一的組織至少在一個業務功能中“定期”使用生成式人工智慧。考 .... (往下繼續閱讀)

by 程宇肖
2023/8/29
14 分鐘閱讀時間

A- A A+

文章目錄

Google 升級 Vertex AI 以追趕生成式人工智慧熱潮

背景

最近由《財富》和 Deloitte 聯合進行的一項調查發現，全球超過一半的 CEO 正在進行 AI 的實驗，以生成文字、影象和其他形式的資料。同時麥肯錫的一份報告顯示，三分之一的組織至少在一個業務功能中“定期”使用生成式人工智慧。考慮到這個龐大的（而且顯然不斷增長的）可開發市場，毫不奇怪，Google 雲正在努力保持與時俱進。在其年度 Cloud Next 會議上，Google 宣布對 Vertex AI 進行了更新，該平臺提供了用於構建、訓練和部署機器學習模型的工作流程。Vertex AI 現在包括了更新後的用於文字、影象和程式碼生成的 AI 模型以及 Anthropic 和 Meta 等新創公司提供的新的第三方模型以及讓開發人員整合公司資料並代表使用者採取行動的擴充套件功能。

開放的生態系統

Google 在新聞簡報中提到：“[透過 Vertex]，我們採用了一種非常開放的生態系統方法，與廣泛的生態系統合作夥伴合作，為客戶提供選擇和靈活性。”Google 強調他們建立了一種以企業就緒為核心的生成式人工智慧方法，並著重於資料治理、負責任的人工智慧安全等方面。在模型方面，Google 聲稱已經“顯著”升級了其用於程式碼生成的 Codey 模型，為程式碼生成的“主要支援語言”提供了 25％的質量改進。Google 還更新了 Imagen 模型，以提高生成影象的質量並支援風格調整，使客戶能夠使用僅有 10 個參考影象就能建立“符合其品牌”的影象。此外 Google 的 PaLM 2 語言模型懂得新的語言（38 種已正式提供，100 多種處於預覽階段），並擁有擴充套件的 32,000 個 token 的上下文視窗。在生成任何其他文字之前，上下文視窗是指模型考慮的文字範圍。32,000 個 token 相當於約 25,000 個詞，大約相當於 80 頁的雙倍行距文字。儘管 PaLM 2 的上下文視窗不是最大的，Anthropic 的 Claude 2 擁有 100,000 個 token 的上下文視窗，是原始 PaLM 2 和 GPT-4 的 3 倍大。然而 Google 選擇選擇 32,000 個 token，是基於“靈活性”和“成本”的考慮。Google 表示他們的客戶在努力平衡使用大型模型進行建模和生成場景的靈活性與基於推斷的成本以及偵錯能力之間。他們認為，使用 32,000 個 token 進行評估所得到的結果相當令人印象深刻，能夠在新功能和市場中提供具有競爭力的價效比。

模型庫的擴充套件

然而並非所有的客戶都會同意這種觀點。因此 Google 在 Vertex AI 的模型庫中加入了像 Claude 2 這樣的第三方模型，這是一個集合了預設模型和工具的庫，可以根據企業的需求進行定制。其他加入模型庫的模型包括 Meta 最近推出的 Llama 2 和 Technology Innovation Institute 的開源 Falcon LLM。這些新的模型增加對付 Amazon Bedrock 的競爭壓力，Bedrock 是亞馬遜最近推出的 AWS 產品，透過新創公司 AI21 Labs、Anthropic 和 Stability AI 的預設模型提供了一種構建生成式 AI 應用程式的方式。再加上 Bedrock 的坎坷推出，也許 Google 看到了在託管模型服務的新生市場中建立立足點的機會。

資料存取器和模型擴充套件

為了在這兩種方式中擁有更多選擇，Google 還將擴充套件功能和資料存取器帶入了 Vertex AI。擴充套件功能是一組工具，可以讓開發人員將模型與實時資料、專有資料或第三方應用程式（如客戶關係管理系統或電子郵件帳戶，例如 Datastax、MongoDB 或 Redis）相存取，甚至能夠代表使用者執行操作。資料存取器則可以從多個平臺讀取企業和第三方資料，例如 Salesforce、Confluence 和 Jira。與此相關的是，Vertex AI 現在支援 Ray，這是一個用於擴充套件用 Python 編寫的 AI 和工作負載的開源計算框架。這是 Vertex AI 已經支援的框架之一，包括 Google 自家的 TensorFlow。

倫理和法律挑戰

不過令人驚訝的是，Google 再次回避了與所有形式的生成式人工智慧相關的許多道德和法律挑戰，尤其是版權問題。類似於 PaLM 2 和 Imagen 這樣的 AI 模型，它們透過“訓練”現有資料來“學習”生成文字和影象，而這些資料通常來自在網路上搜尋版權公開資料源所得到的資料集。Google 之前曾告訴 TechCrunch，他們透過廣泛的“資料治理審查”來“檢視模型內的源資料”，以確保它們“沒有版權索賠”。但即使慷慨地假設 Google 的所有 AI 訓練資料都不包含任何版權材料，Google 和其他許多競爭對手也沒有提供一個讓除了 Vertex AI 客戶以外的資料擁有者排除其資料用於模型訓練的選項。更大的未解答問題是，Vertex AI 的客戶是否真正擁有他們使用 AI 生成的內容。至少在美國，當前並不清楚 AI 生成的藝術是否可以受版權保護。對於這個問題，Google 沒有答案，至少沒有一個準備好的答案。

Vertex AI 中的搜尋和對話

搜尋和對話功能

Google 在 Vertex 中提供了兩個產品——Vertex AI 搜尋和 Vertex AI 對話，旨在簡化生成式搜尋和對話應用程式的複雜性。Vertex AI 搜尋（之前稱為企業搜尋和生成式 AI 應用程式生成器）和 Vertex AI 對話（之前稱為生成式 AI 應用程式生成器上的對話和對話 AI）已經推出。借助這兩個工具，開發人員可以將資料輸入並進行自定義，以構建一個可以與客戶互動並回答基於企業資料的問題的搜尋引擎、聊天機器人或“語音機器人”。Google 預計這些工具可用於構建食品訂購、銀行協助和半自動化客戶服務等應用程式。

新功能

隨著 Vertex AI 搜尋和 Vertex AI 對話的推出，新增了多輪搜尋功能，這使得在不從頭開始的情況下能夠對後續問題進行提問。另一個新功能是搜尋結果和對話摘要，可對搜尋結果和聊天對話進行摘要。此外 Vertex 中的另一個新功能是 Playbook（Vertex AI 對話的預覽版），它可以讓使用者以自然語言為回應定義要執行的語音和聊天機器人任務，類似於告訴一個人如何處理任務。使用者可以新增角色（“您是一位對於電子商務網站上的腳踏車非常瞭解且友好的專家”）、目標（“幫助客戶完成支付”）、步驟（“請求信用卡號碼，然後請求運送位址”）以及展示目標實現的理想方式的示例。Vertex AI 的模型擴充套件和資料存取器可以與 Vertex AI 搜尋和 Vertex AI 對話一起使用。此外一個名為 Grounding 的新功能可以將模型的輸出根據公司的資料進行歸納，例如，透過使模型明確引用其對問題的回答。Google 表示 Vertex AI 搜尋將很快支援企業存取控制，以“確保只有適當的使用者能夠使用訊息”，並提供關於結果的相關性得分以“增強信心”和使其“更有用”。然而考慮到生成式 AI 模型編造事實的傾向，一切都令人懷疑。總是有惡意行為者透過欺騙注入攻擊來使模型偏離軌道。在這種情況下，無論是文字生成還是影象生成的模型，都可能產生有毒內容——這是用於訓練它們的資料中偏見的一種表現。Bardoliwalla（Vertex AI 的產品負責人）主張，即使 Grounding 工具不能解決生成模型中的虛幻和有毒問題，它們至少是向正確方向邁出的一步。他說：“我們認為，對於權威來源的一套全面的基礎功能是解決虛幻問題並使其更可靠的一種方式。”在之前的一次訪談中，Bardoliwalla 表示每次對託管在 Vertex 中的生成式模型進行 API 呼叫時，都會對“安全屬性”進行評估，包括有毒性、暴力和淫穢性。Vertex 會對模型進行評分，並根據某些類別的情況阻止響應或讓客戶選擇如何繼續。隨著生成式人工智慧模型變得越來越複雜和難以解釋，我不禁懷疑這種方式是否可持續。我們（以及 Google 雲的客戶）將拭目以待。

ArtificialIntelligence-Google,VertexAI,生成式人工智慧,強化,熱潮

產品管理

專案管理

Web 3

AIGC

專案故事

專案工具

網路議題

閱讀心得

軟體測試

程式筆記

職涯觀點

日常生活

市場觀察

資料收集