Anthropic 宣稱其新模型超越 GPT-4

# 人類主義宣稱其新模型超越了 GPT-4Anthropic 宣稱其 Claude 3 模型超越了 GPT-4 由凱爾·維格斯（Kyle Wiggers）發表於 8 小時前的一篇文章中，人工智慧新創公司 Anthropic，在獲得數億美元風險投資的支援下（甚至可能很快就會再獲得數億美元的投資），今天宣 .... (往下繼續閱讀)

by 江塵
2024/3/5
12 分鐘閱讀時間

A- A A+

文章目錄

# 人類主義宣稱其新模型超越了 GPT-4

Anthropic 宣稱其 Claude 3 模型超越了 GPT-4

由凱爾·維格斯（Kyle Wiggers）發表於 8 小時前的一篇文章中，人工智慧新創公司 Anthropic，在獲得數億美元風險投資的支援下（甚至可能很快就會再獲得數億美元的投資），今天宣布了其最新版本的人工智慧技術 GenAI，命名為 Claude。公司聲稱，它在效能上可與 OpenAI 的 GPT-4 相媲美。Anthropic 的新一代 GenAI 名為 Claude 3，包括了三種模型，分別為 Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus，其中 Opus 是效能最強勁的。Anthropic 聲稱，所有這些模型在分析和預測方面都表現出了“增強的能力”，並且在特定基準上的效能優於像 GPT-4（但不包括 GPT-4 Turbo）和 Google 的 Gemini 1.0 Ultra（但不包括 Gemini 1.5 Pro）等模型。值得注意的是，Claude 3 是 Anthropic 首次推出的多模態 GenAI，這意味著它既可以分析文字，又可以分析影象，類似於 GPT-4 和 Gemini 的某些版本。Claude 3 可以處理照片、圖表、圖形和技術圖表等各種影象，並能夠從 PDF、幻燈片和其他檔案型別中獲取訊息。與一些 GenAI 競爭對手相比，Claude 3 更進一步可以在單個請求中分析多個影象（最多 20 張）。Anthropic 表示這使得它可以比較和對比影象。然而 Claude 3 的影象處理存在一定的局限性。Anthropic 已經禁用了模型識別人物的功能，無疑是對道德和法律影響的警惕。公司承認，Claude 3 在處理“低質量”影象（少於 200 畫素）時容易出錯，並且在涉及空間推理（例如閱讀模擬時鐘面）和物件計數的任務中表現不佳（Claude 3 無法準確計算影象中的物件數量）。此外 Claude 3 也不太可能生成藝術作品，這些模型只能進行影象分析，至少當前是這樣。不論是處理文字還是影象，Anthropic 表示與其前身相比，使用者通常可期望 Claude 3 在遵循多步驟指令、以 JSON 等格式生成結構化輸出和使用非英語語言進行交流方面表現更佳。Anthropic 還表示由於對請求的“更細緻的理解”，Claude 3 應該會更少地拒絕回答問題。不久之後，Claude 3 將會引用其回答問題的來源，以便使用者取證回答內容。「Claude 3 傾向於生成更具表達力和吸引力的回應」，Anthropic 在一篇支援文章中寫道。「[它]比我們過去的模型更容易引導和操作。使用者應該會發現他們可以用更簡潔的提示達到期望的結果。」其中一些改進來自於 Claude 3 擴充套件的上下文。模型的上下文指的是模型在生成輸出之前考慮的輸入資料（例如文字）。上下文視窗較小的模型往往“忘記”了甚至是非常近期的對話內容，使它們往往會偏離話題——通常是一些問題所在。而對於上下文視窗較大的模型，它們能更好地理解它們所吸收的資料的敘事流程，從而生成更具上下文豐富的回應（至少在假設條件下是如此）。Anthropic 表示 Claude 3 最初將支援一個 20 萬 token 的上下文視窗，相當於約 15 萬個詞，而選定的客戶將獲得高達 100 萬 token（大約 70 萬個詞）的上下文視窗。這與 Google 最新的 GenAI 模型 Gemini 1.5 Pro 提供的最多 100 萬上下文視窗相當。然而僅僅因為 Claude 3 是前一代的升級，並不意味著它就是完美無缺的。在一份技術白皮書中，Anthropic 承認，Claude 3 並不免於困擾其他 GenAI 模型的問題，即偏見和妄想（即編造內容）。與一些 GenAI 模型不同，Claude 3 無法搜尋網路；這些模型只能使用 2023 年 8 月之前的資料來回答問題。儘管 Claude 是多語言的，但它對於某些“低資源”語言的流利程度不如英語。然而 Anthropic 承諾 Claude 3 將在未來幾個月經常更新。「我們認為模型智慧尚遠未到極限，我們計劃在未來幾個月內對 Claude 3 模型系列進行[增強]發布。」該公司在一篇部落格文章中寫道。Opus 和 Sonnet 現在可以透過網站以及 Anthropic 的開發控制臺和 API、亞馬遜的 Bedrock 平臺以及 Google 的 Vertex AI 進行購買。Haiku 將於今年晚些時候推出。以下是價格分解：Opus：每 100 萬輸入 token 15 美元，每 100 萬輸出 token 75 美元 Sonnet：每 100 萬輸入 token 3 美元，每 100 萬輸出 token 15 美元 Haiku：每 100 萬輸入 token 0.25 美元，每 100 萬輸出 token 1.25 美元這就是 Claude 3。而這項技術的長遠前景又如何呢？正如我們之前報導的那樣，Anthropic 的抱負是建立一種“下一代自我教學的人工智慧算法”。這樣的算法可以用於構建虛擬助手，它們能夠回答郵件、進行研究並生成藝術品、書籍等等，我們已經在 GPT-4 等大型語言模型中見識到了一些這些功能。Anthropic 在上述部落格文章中暗示了這一點，表示該公司計劃為 Claude 3 新增功能，透過與其他系統互動，以“互動式”方式程式設計並提供“高級的代理能力”來增強其出廠功能。這最後一點讓人想起了 OpenAI 報道的抱負，即構建一個軟體代理，自動化執行諸如從檔案中轉移資料、自動填寫和進入會計軟體的費用報告等複雜任務。OpenAI 已經提供了一個 API，允許開發人員在其應用中構建“類似代理的體驗”，而 Anthropic 似乎打算提供與之相匹敵的功能。我們能否在 Anthropic 之後看到影象生成器呢？老實說，這讓我感到驚訝。當前影象生成器在很大程度上受到爭議，主要是由於版權和偏見問題。Google 最近被迫關閉了其影象生成器，因為它對歷史背景毫不顧忌地注入了多樣性。此外一些影象生成器供應商正在與指控它們未向藝術家提供賠償甚至是信用就利用他們的作品訓練 GenAI 的法律戰鬥之中。我很好奇 Anthropic 用於訓練 GenAI 的技術“憲法 AI”的演變。該公司聲稱，這使其 GenAI 的行為更易於理解、更可預測並且也更容易根據需要進行調整。憲法 AI 的目標是提供一種與人類意圖相一致的方式，使模型能夠根據一組簡單的指導原則來回答問題和執行任務。例如，對於 Claude 3，Anthropic 表示它增加了一個原則——受眾眾包的反饋所啟發——指示模型要理解並且對有殘障的人友好與親切。無論 Anthropic 的最終目標是什麼，該公司都將長期參與其中。根據去年 5 月泄露的一份招商檔案，公司計劃在接下來的 12 個月左右籌集高達 50 億美元的資金——這可能僅僅是它為了保持與 OpenAI 競爭所需的基準。畢竟，訓練模型可不是件便宜事。它已經在這方面取得了進展，Google 和亞馬遜分別已經承諾了 20 億和 40 億美元，而其他資助方的承諾總額也超過 10 億美元。關鍵字：人工智慧-人類主義, 新模型, 超越, GPT-4

ArtificialIntelligence-Anthropic,新模型,超越,GPT-4

產品管理

專案管理

Web 3

AIGC

專案故事

專案工具

網路議題

閱讀心得

軟體測試

程式筆記

職涯觀點

日常生活

市場觀察

資料收集

Anthropic 宣稱其新模型超越 GPT-4

文章目錄

Anthropic 宣稱其 Claude 3 模型超越了 GPT-4

延伸閱讀

蘋果因反競爭行為被歐盟罰款，Epic Games 的 Tim Sweeney 對其「苦苦抱怨」

「Disrupt 2024」演講嘉賓招募現已開放

江塵