
2023 年 7 月 5 日編者註
本文已經根據 Science X 的編輯流程和政策進行了審查。編輯人員在確保內容可信度的同時強調了以下特點:事實核查、預印本可信來源、校對。
新的廚師資料集將人工智慧引入烹飪
人工智慧(AI)可以幫助人們購物、計劃和寫作,但在烹飪方面卻力有未逮。但喬治亞理工學院計算機學院的最新研究可能會改變這一現狀。研究人員建立了一個名為 ChattyChef 的資料集,該資料集使用自然語言處理模型,可以幫助使用者進行烹飪。利用開源的大型語言模型 GPT-J,ChattyChef 的烹飪對話資料集遵循使用者的食譜。研究人員在“改進食譜對話中的指令排序”這篇論文中介紹了他們的 AI 研究成果,並將該研究發表在 arXiv 預印本伺服器上。
儘管其他研究人員曾經理論上探討過 AI 廚師的可能性,但喬治亞理工學院的這項工作推動了這個領域的進一步發展。「我們是第一個研究小組之一,分析使用大型語言模型構建 AI 廚師所面臨的挑戰」,互動計算學院的博士生 Duong Le 表示。
大多數使用語言模型進行烹飪的嘗試都失敗了,因為 GPT-J 不理解使用者接下來想做什麼,或者稱之為使用者意圖,並且很難追蹤使用者在烹飪過程中的進度,也就是研究人員所稱的「對話的狀態」。它也不能輕易回答澄清性問題,例如關於成分用量或烹飪時間的問題。例如,有人想烹製土豆餅。AI 告訴他們在鍋中融化牛油並加入土豆。然後使用者問接下來的步驟。一個較差的機器人可能會亂掉線序,告訴他們即使還沒烹煮完成也要上菜土豆餅。或者使用者提出了一個跟烹飪土豆餅需要多長時間的追加問題,AI 將無法提供準確的答案,只會給出一個大致的時間,而不指定每一面的烹飪時間。
關鍵特點
在此基礎上,研究人員確保他們的模型具有兩個關鍵特點:
- 使用者意圖檢測:可以確保使用者在一組固定可能性中的當前意圖,例如「要求下一步指示」或「詢問材料細節」。
- 指令狀態追蹤:能夠識別使用者使用食譜時所處的步驟,並以 80%的準確率工作。
這些特點的結合為 ChattyChef 帶來了第三個創新——回應生成。使用者意圖有助於生成最佳回應,以回答使用者的問題。指令狀態選擇最相關的食譜部分,而不是包含整個食譜,以避免讓使用者感到困惑,或在烹飪過程中負擔太多的步驟。ChattyChef 資料集是基於維基百科教人們如何烹飪的食譜(該食譜具有正面評價並且步驟少於八個)。研究人員透過眾包的方式讓參與者扮演角色,以理解他們如何使用 ChattyChef,並確保在資料集中應該包含哪些指示。研究人員認為,ChattyChef 的創新可能在除了烹飪之外的許多領域中都得到應用,例如修理手冊或軟體檔案。
更多訊息:
- Duong Minh Le et al, Improved Instruction Ordering in Recipe-Grounded Conversation, arXiv (2023). DOI: 10.48550/arxiv.2305.17280
資料來源:
https://techxplore.com/news/2023-07-chef-dataset-ai-cooking.html
版權宣告:
本文僅供私人研究和研究用途。未經書面許可,任何部分均不得以任何形式重製。本文僅供訊息參考。
關鍵詞:廚師資料集, 人工智慧, 烹飪
延伸閱讀
- 加州新 AI 法案出爐,SB 1047 作者再推出改革措施!
- 《超級瑪利歐成為 AI 基準測試的新標準!你絕對想不到的理由》
- Google 推出 SpeciesNet:專為識別野生動物而設的人工智慧模型!
- 安瑟普提克獲得 35 億美元巨額資金 瞄準人工智慧未來!
- OpenAI 重磅推出 GPT-4.5:歷史上最大的語言模型來了!
- 探索 DeepSeek:你必須理解的 AI 聊天機器人應用全指南!
- OpenAI 的創業帝國:揭密其風投基金背後的諸多創新公司
- 揭開 Mistral AI 的神祕面紗:揭示 OpenAI 競爭者的所有祕密!
- 未來科技:研究人員揭示如何打造變形機器人,猶如 T-1000 般神奇!
- ElevenLabs 推出全新語音轉文字模型,引領 AI 語音技術的新潮流!