AIGC

Patronus AI 為受規範產業打造 LLM 評估工具

Patronus AI 推出給受規範產業使用的 LLM 評估工具「Patronus AI」透過提供受規範產業使用的 LLM 評估工具，引起了廣泛關注。兩位曾在 Meta 進行負責任人工智慧研究的專家，Rebecca Qian 和 Anand Kannappan，於去年三月共同創立了 Patronu .... (往下繼續閱讀)

by 程宇肖
2023/9/14
5 分鐘閱讀時間

A- A A+

文章目錄

Patronus AI 推出給受規範產業使用的 LLM 評估工具

「Patronus AI」透過提供受規範產業使用的 LLM 評估工具，引起了廣泛關注。

兩位曾在 Meta 進行負責任人工智慧研究的專家，Rebecca Qian 和 Anand Kannappan，於去年三月共同創立了 Patronus AI。他們的目標是建立一個能夠評估和測試大型語言模型的解決方案，尤其針對對錯容忍度低的受規範產業。在最近，該公司有了重大突破，正式公開推出其產品，並宣布完成 300 萬美元的種子輪融資。

該公司建立了一個以服務形式呈現的安全和分析框架，用於測試大型語言模型並識別可能存在問題的領域，特別是可能出現幻覺的情況。所謂幻覺，是指模型因缺乏能正確回答問題的資料而捏造答案。

自動化 LLM 評估的三個步驟

該公司的 CTO Rebecca Qian 告訴 TechCrunch，他們的產品透過三個步驟來自動化 LLM 的評估過程。首先是評分，即幫助使用者在真實場景中對模型進行評分，例如金融行業可能對幻覺等關鍵標準進行評估。其次該產品會生成測試案例，自動生成對抗性測試套件，並對模型進行壓力測試。最後根據不同的要求，對模型進行評估，找到最適合特定工作的模型。

專注於高度規範的行業

Patronus AI 專注於高度規範的行業，因為錯誤的答案可能帶來巨大的後果。該公司的執行長 Anand Kannappan 解釋道：“我們幫助公司確保他們使用的大型語言模型是安全的。我們檢測模型產生商業敏感訊息和不適當輸出的情況。”他表示該新創公司的目標是在評估模型時成為可信賴的第三方機構。“有人很容易說他們的 LLM 是最好的，但需要有一個無偏見、獨立的觀點。這就是我們的定位。Patronus 是可靠的標誌。”

針對用量收費的商業模式

考慮到該公司和工程團隊想要評估的評估量和樣本，該公司計劃採用基於使用量的定價模式。當前該公司有六名全職員工，但考慮到該領域的快速增長，他們計劃在未來幾個月內僱用更多人，雖然沒有確保的數量。Rebecca Qian 表示多樣性是該公司的一個重要支柱。她說：“這是我們非常關心的一點。這始於 Patronus 的領導層。隨著我們的發展，我們打算繼續制定計劃和措施，確保我們創造和維護一個包容性的工作環境。”

獲得 300 萬美元種子輪融資

今天的 300 萬美元種子輪融資由 Lightspeed Venture Partners 領投，Factorial Capital 和其他行業天使投資人參與。

ArtificialIntelligence-PatronusAI,受規範產業,LLM 評估工具

市場觀察

AIGC

Web 3

專案故事

網路議題

產品管理

專案管理

閱讀心得

職涯觀點

日常生活

專案工具

資料收集