AIGC

Patronus AI 為受規範產業打造 LLM 評估工具

Patronus AI 推出給受規範產業使用的 LLM 評估工具「Patronus AI」透過提供受規範產業使用的 LLM 評估工具,引起了廣泛關注。兩位曾在 Meta 進行負責任人工智慧研究的專家,Rebecca Qian 和 Anand Kannappan,於去年三月共同創立了 Patronu .... (往下繼續閱讀)

分享到 Facebook 分享到 Line 分享到 Twitter

文章目錄

Patronus AI 為受規範產業打造 LLM 評估工具

Patronus AI 推出給受規範產業使用的 LLM 評估工具

「Patronus AI」透過提供受規範產業使用的 LLM 評估工具,引起了廣泛關注。

兩位曾在 Meta 進行負責任人工智慧研究的專家,Rebecca Qian 和 Anand Kannappan,於去年三月共同創立了 Patronus AI。他們的目標是建立一個能夠評估和測試大型語言模型的解決方案,尤其針對對錯容忍度低的受規範產業。在最近,該公司有了重大突破,正式公開推出其產品,並宣布完成 300 萬美元的種子輪融資。

該公司建立了一個以服務形式呈現的安全和分析框架,用於測試大型語言模型並識別可能存在問題的領域,特別是可能出現幻覺的情況。所謂幻覺,是指模型因缺乏能正確回答問題的資料而捏造答案。

自動化 LLM 評估的三個步驟

該公司的 CTO Rebecca Qian 告訴 TechCrunch,他們的產品透過三個步驟來自動化 LLM 的評估過程。首先是評分,即幫助使用者在真實場景中對模型進行評分,例如金融行業可能對幻覺等關鍵標準進行評估。其次該產品會生成測試案例,自動生成對抗性測試套件,並對模型進行壓力測試。最後根據不同的要求,對模型進行評估,找到最適合特定工作的模型。

專注於高度規範的行業

Patronus AI 專注於高度規範的行業,因為錯誤的答案可能帶來巨大的後果。該公司的執行長 Anand Kannappan 解釋道:“我們幫助公司確保他們使用的大型語言模型是安全的。我們檢測模型產生商業敏感訊息和不適當輸出的情況。”他表示該新創公司的目標是在評估模型時成為可信賴的第三方機構。“有人很容易說他們的 LLM 是最好的,但需要有一個無偏見、獨立的觀點。這就是我們的定位。Patronus 是可靠的標誌。”

針對用量收費的商業模式

考慮到該公司和工程團隊想要評估的評估量和樣本,該公司計劃採用基於使用量的定價模式。當前該公司有六名全職員工,但考慮到該領域的快速增長,他們計劃在未來幾個月內僱用更多人,雖然沒有確保的數量。Rebecca Qian 表示多樣性是該公司的一個重要支柱。她說:“這是我們非常關心的一點。這始於 Patronus 的領導層。隨著我們的發展,我們打算繼續制定計劃和措施,確保我們創造和維護一個包容性的工作環境。”

獲得 300 萬美元種子輪融資

今天的 300 萬美元種子輪融資由 Lightspeed Venture Partners 領投,Factorial Capital 和其他行業天使投資人參與。

ArtificialIntelligence-PatronusAI,受規範產業,LLM 評估工具

程宇肖

程宇肖

Reporter

大家好!我是程宇肖,我對於科技的發展和應用有著濃厚的興趣,並致力於將最新的科技趨勢和創新帶給大家。科技領域的變化速度驚人,每天都有令人興奮的新發現和突破。作為一名部落格作者,我將帶領大家深入探索科技的奧秘和應用的無限可能。