網路議題

鴻蒙驚豔 AI 世界,Pinecone 引領向量資料庫創新巔峯!

Pinecone:向量資料庫在生成式人工智慧時代的獨特地位最近,一種新型的資料庫 - 向量資料庫,正在開發者和企業間引起熱潮。這種資料庫可以儲存並查詢影象、文字和影片等非結構化資料,受到建造生成式人工智慧應用(如聊天機器人、推薦系統和內容生成)的開發者和企業的歡迎。Pinecone 是向量資料庫技術 .... (往下繼續閱讀)

分享到 Facebook 分享到 Line 分享到 Twitter

文章目錄

鴻蒙驚豔 AI 世界,Pinecone 引領向量資料庫創新巔峯!

Pinecone向量資料庫在生成式人工智慧時代的獨特地位

最近,一種新型的資料庫 - 向量資料庫,正在開發者和企業間引起熱潮。這種資料庫可以儲存並查詢影象、文字和影片等非結構化資料,受到建造生成式人工智慧應用(如聊天機器人、推薦系統和內容生成)的開發者和企業的歡迎。Pinecone向量資料庫技術領域的領先供應商之一,成立於 2019 年,已經籌集了 1.38 億美元的資金,估值達到 7.5 億美元。該公司表示當前擁有「超過 10 萬個免費使用者和超過 4,000 個付費客戶」,顯示了小型公司和企業紛紛採用該技術並進行創新應用的熱潮。相比之下,Pinecone 在去年 12 月的時候,只有不到數千個免費使用者和不到 300 個付費客戶。公司近期在舊金山舉行了一場使用者大會,展示了一些成功案例,並宣布與微軟 Azure 建立合作夥伴關係,加速為 Azure 使用者提供生成式人工智慧應用。

向量資料庫:生成式人工智慧時代的獨特資料庫

Bob Widerhold 在 VB Transform 發表的主題演講中,指出生成式人工智慧是一個超越網際網路的新平臺,而向量資料庫是實現該平臺的關鍵。他表示生成式人工智慧平臺將比網際網路更大,並「對世界產生同樣甚至更大的影響」。Widerhold 解釋了向量資料庫的優點:它可以讓開發者存取在網際網路或傳統資料庫中無法獲得的領域專屬資訊,並實時更新這些資訊。這樣一來,開發者可以為聊天機器人或 GPT-4 這樣的生成式人工智慧模型提供更好的上下文和準確性。這些模型通常是使用從網際網路上爬取的過時或不完整的資料進行訓練的,而向量資料庫可以將所有資料轉換為向量,從而實現「最近鄰居」檢索,提供更豐富的上下文視窗,從而減少訓練模型出現誤判的情況。

向量資料庫市場前景

對於向量資料庫市場的規模問題,Widerhold 表示這是一個非常龐大的市場,未來可能達到 100 億美元甚至更高,但這還不確保,需要在未來兩三年中透過實踐逐步確保。他認為,當新的資料型別和存取模式出現時,如果市場足夠大,就會形成一個新的資料庫市場子集,這在過去出現在聯動式資料庫和非聯動式資料庫之間的競爭中已經發生過。他解釋說,向量是一種非常不同的資料表示方式,最近鄰居檢索是一種非常不同的資料存取方式。他還解釋說,向量資料庫透過更有效地基於這種新範式進行資料分割槽,填補了聯動性資料庫和非聯動性資料庫無法填補的空白。他還表示 Pinecone 技術是從頭開始構建的,並且在效能、可擴充套件性和成本方面沒有妥協。他表示只有透過從頭開始構建,才能實現最低延遲、最高速度和最低成本。

生成式人工智慧市場的盈虧周期

Widerhold 同時承認,生成式人工智慧市場正在經歷一個被誇大的熱潮,即將進入一個「現實低谷」階段,開發者們將不再只是進行無法進入生產的應用的原型設計。他認為,這對整個行業來說是件好事,因為這將把真正適用於生產、具有影響力的應用區分出來,從而區分出現有多數的原型應用中的「虛有其表」。據 Widerhold 指出,6 月份 ChatGPT 的使用者數量減少以及 Pinecone 自己的使用者數量趨於平穩,在去年 12 月至今年 4 月的時候呈現了「驚人的」增長,而在 5 月和 6 月的時候回落到一個更為合理的水平。

生成式 AI 市場的前景與向量資料庫

Widerhold 在 VB Transform 上回答有關向量資料庫市場規模的問題時表示這是一個非常大或甚至巨大的市場,但當前還不清楚它是否會成為一個 100 億美元或 1,000 億美元的市場。他說,隨著最佳實踐在未來兩三年中得到確保,這個問題將得到解答。他說,當前有很多不同的生成式 AI 技術應用方式正在進行實驗,一個重要的問題是將較大的上下文視窗應用於大型語言模型提示。如果開發者能夠將更多的資料,甚至可能是整個資料庫,直接放入上下文視窗中,那麼就不需要使用向量資料庫來搜尋資料。但他認為這種情況不太可能發生。他引用了斯坦福大學這週發布的一項研究,該研究探索了現有聊天機器人技術,結果發現上下文視窗中的訊息量越小,結果越好。他表示訊息只有在管理得宜、可內化時才最有用,這也適用於上下文視窗中的大量訊息。他解釋說,一些大型企業正在嘗試訓練自己的基礎模型,而其他企業則在微調現有的基礎模型,這兩種方法都需要大量的專業知識並具有高昂的成本。他說:「只有有限數量的公司能夠承擔這種成本。」

ArtificialIntelligence-鴻蒙驚豔,AI,世界,Pinecone,向量資料庫,創新,巔峯
程宇肖

程宇肖

Reporter

大家好!我是程宇肖,我對於科技的發展和應用有著濃厚的興趣,並致力於將最新的科技趨勢和創新帶給大家。科技領域的變化速度驚人,每天都有令人興奮的新發現和突破。作為一名部落格作者,我將帶領大家深入探索科技的奧秘和應用的無限可能。