#語言模型

9 篇文章

Google 公佈利用影片和大型語言模型訓練機器人的新方法
777

Google 公佈利用影片和大型語言模型訓練機器人的新方法

Google 發表了利用影片和大型語言模型來訓練機器人的新方法 Google DeepMind Robotics 團隊最新研究成果 Google 近日發表了一篇部落格文章,介紹了他們的 DeepMind Robotics 團隊正在進行的最新研究,旨在讓機器人更好地理解我們人類對它們的期望。傳統上,機器人

Giga ML 推出離線部署低資源語言模型幫助企業
1225

Giga ML 推出離線部署低資源語言模型幫助企業

離線部署語言模型:企業面臨的挑戰 挑戰與需求企業組織普遍認為部署大型語言模型(LLMs)至 2024 年初是一項最重要的目標。然而相關調查顯示,缺乏客製化和靈活性以及無法保留公司知識和智慧財產權,是阻礙企業將 LLMs 應用於生產的主要障礙。此外企業對於隱私權和資料定制方面的擔憂也是影響因素。Gi

幫助電腦視覺和語言模型理解它們所看到的
1056

幫助電腦視覺和語言模型理解它們所看到的

幫助電腦視覺和語言模型理解所見的世界引言在過去幾年中,隨著人工智慧的發展,電腦視覺和語言模型在影象分析和自然語言處理方面取得了驚人的成果。然而這些模型在理解概念和場景中的物體屬性和排列方式方面仍然存在困難。為理解決這個問題,麻省理工學院的研究人員建立了一個合成資料集,用於改進機器學習模型對場景中概念

遇見 Phi-1.5,這個新語言模型可能使 AI 訓練更便宜更快速
914

遇見 Phi-1.5,這個新語言模型可能使 AI 訓練更便宜更快速

訓練人工智慧大型語言模型的新方法:Phi-1.5 的開拓引言訓練人工智慧(AI)大型語言模型(LLM),如 ChatGPT、LLaMA 2、Claude 2、Bard、Falcon 180B 等,通常需要大量且專門的運算能力。因此開放式人工智慧專案(OpenAI)、Meta、Cohere、Googl

Naver 加入生成式 AI 競賽,推出超大規模語言模型 HyperCLOVA X!
835

Naver 加入生成式 AI 競賽,推出超大規模語言模型 HyperCLOVA X!

韓國網際網路巨頭 Naver 推出新一代大型語言模型 HyperCLOVA XNaver 開始測試 HyperCLOVA X 以及企業定制的計劃在 AI 競賽中有一個新的強勢參與者出現了。韓國網際網路巨頭 Naver 今天宣布推出 HyperCLOVA X,這是他們的下一代大型語言模型(LLM),透

AI2 釋出迄今最大開放資料集,專為訓練語言模型提供!
866

AI2 釋出迄今最大開放資料集,專為訓練語言模型提供!

AI2 釋出迄今最大的開放資料集,為訓練語言模型鋪路 AI2(Allen Institute for AI)旨在打破現有的趨勢,釋出全新且龐大的文字資料集 Dolma,該資料集可以免費使用並且公開查閱。Dolma 將成為 AI2 研究團隊計劃中開放語言模型(OLMo)的基礎(Dolma 縮寫為“用於滿

NCSoft 揭示 VARCO AI 語言模型,引領未來智慧科技潮流
853

NCSoft 揭示 VARCO AI 語言模型,引領未來智慧科技潮流

NCSoft 發布 VARCO LLM 智慧語言模型,為遊戲開發帶來革新引言 NCSoft 宣布將推出一系列的 AI 語言模型,統稱為 VARCO LLM。它包括四個語言模型和由這些語言模型提供支援的生成式 AI 服務。其中三個生成式 AI 服務是為改進遊戲開發效率而設計的。根據該公司的說法,VARC

研究人員成功引誘大型語言模型提供禁止回應
1399

研究人員成功引誘大型語言模型提供禁止回應

研究引誘大型語言模型提供禁止回應導言最近幾個月的文章詳細描述了一些主要問題,包括虛假資訊、不當和冒犯性內容、隱私侵犯以及對弱勢使用者造成的心理傷害,這些都引發了關於是否以及如何控制此類內容的問題。OpenAI 和 Google 等公司已經設計了保護性屏障,以遏制一些極端的偏見和冒犯性內容事件,但很明

擊敗虛假「事實」的兩個小詞:一種將大型語言模型的答案紮根於現實的新技術
723

擊敗虛假「事實」的兩個小詞:一種將大型語言模型的答案紮根於現實的新技術

虛假事實與現實的對抗:一種將大型語言模型答案與現實連結的新技術引言近日紐約一名律師因使用大型語言模型(LLMs)ChatGPT 在法庭上提供的虛假資訊而遭遇尷尬。儘管這些模型在訓練過程中使用了大量事實資料,但它們還是會產生虛假資訊,俗稱「幻覺」。這種幻覺可能發生在 LLMs 對於少接觸的主題生成文字

«123»