
OpenAI 讓 GPT-4 對一般開發者開放使用
作者:
OpenAI 宣布透過其應用程式設計介面 (API) ,將其最新的文字生成模型 GPT-4 面向全球開發者開放使用。從今天下午開始,所有已有“成功付款歷史”的 OpenAI API 開發者都可以存取 GPT-4。該公司計劃在本月底之前開放給新開發者,然後根據“計算資源可用性”一步步提高可用性上限。
OpenAI 在一篇網誌文章中寫道:“自 3 月份以來,數百萬開發者已要求存取 GPT-4 API,每天都有創新產品利用 GPT-4 的範圍不斷擴大。我們期望未來基於對話的模型可以支援任何使用案例。”GPT-4 可以生成包括程式碼在內的文字,並接受影象和文字輸入,這是其前身 GPT-3.5 所無法實現的改進。在各種專業和學術基準上,GPT-4 的效能達到“人類水平”。與 OpenAI 的先前 GPT 模型一樣,GPT-4 是使用公開可用的資料進行訓練,包括公共網頁上的資料以及 OpenAI 獲得許可的資料。影象理解能力當前還未對所有 OpenAI 客戶開放,OpenAI 正在與一個合作夥伴 "Be My Eyes" 進行測試。然而 OpenAI 尚未表示何時將它開放給更廣泛的客戶群體。
值得注意的是,就像當前最佳的生成式 AI 模型一樣,GPT-4 並不完美。它會“幻想”事實並犯下推理錯誤,有時確信滿滿。而且它不能從經驗中學習,在處理難題時出現失敗,例如在生成的程式碼中引入安全漏洞。OpenAI 表示未來將允許開發者使用自己的資料對 GPT-4 和 GPT-3.5 Turbo 進行微調,GPT-3.5 Turbo 是其另一個較新但能力較弱的文字生成模型(也是支援 ChatGPT 的原始模型之一)。根據 OpenAI 的說法,這種功能將在今年晚些時候推出。
生成式 AI 競爭日益激烈
自今年 3 月份公開 GPT-4 以來,生成式人工智慧競爭日益激烈。最近,Anthropic 將其旗艦生成式 AI 模型 Claude 的上下文視窗範圍從 9,000 標記擴充套件到 100,000 標記(上下文視窗是指模型在生成文字之前考慮的文字範圍,而標記代表原始文字,例如單詞“fantastic”將被拆分為標記“fan”、“tas”和“tic”)。GPT-4 在上下文視窗方面一度領先,最高可達到 32,000 標記。一般而言,上下文視窗較小的模型容易“忘記”甚至是最近的對話內容,導致其偏離主題。
OpenAI 開放 DALL-E 2 和 Whisper API 使用
除了 GPT-4 外,OpenAI 還宣布將其影象生成模型 DALL-E 2 和語音轉文字模型 Whisper 的 API 面向全球開發者開放。OpenAI 還表示為了“最佳化計算資源”,將停用其 API 上的舊模型(最近幾個月,由於 ChatGPT 飆升的應用愈發普及,OpenAI 在滿足生成式模型需求方面遇到了困境)。從 2024 年 1 月 4 日開始,某些舊的 OpenAI 模型,特別是 GPT-3 及其衍生模型,將不再提供,並將被新的“基礎 GPT-3”模型所取代,其中擁有更高效的計算能力。使用舊模型的開發者必須在 1 月 4 日之前手動升級其整合,而那些希望繼續使用經過微調的舊模型的人,則需要在基礎 GPT-3 模型上重新進行微調。OpenAI 寫道:“我們將為之前進行過模型微調的使用者提供支援,以使這個過渡盡可能順利。在未來幾週內,我們將與最近使用這些舊模型的開發者聯絡,並在新的完成模型準備好進行早期測試時提供更多訊息。”
OpenAI 的發展揭示出生成式 AI 領域的不斷競爭和進化。儘管存在著一些約束和不足,AI 技術的進步將改變我們與機器之間的互動方式。然而我們需要謹慎對待這些技術,並適時考慮其倫理和社會影響。讓我們期待未來 AI 技術能為我們的生活帶來更多積極的改變。
延伸閱讀
- OpenAI 的創意寫作 AI 讓人想起高中文學社那個討人厭的孩子
- 微軟加速 AI 研發程式,直指 OpenAI 競爭對手
- 一年過去了,OpenAI 的聲音複製工具仍未問世!
- OpenAI 重磅推出 GPT-4.5:歷史上最大的語言模型來了!
- OpenAI 計劃將 Sora 影片生成器整合至 ChatGPT,開啟創意新視界!
- OpenAI 的創業帝國:揭密其風投基金背後的諸多創新公司
- 揭開 Mistral AI 的神祕面紗:揭示 OpenAI 競爭者的所有祕密!
- 「OpenAI 為付費 ChatGPT 使用者推出深度研究功能,探索智慧對話的新境界!」
- 《OpenAI 為何尚未將深度研究成果引入其 API?背後原因大揭密!》
- OpenAI 計劃將計算需求從微軟轉移至軟銀,背後的戰略考量曝光!