遊戲玩家協助凸顯演算法資料差異
作者:路易斯·迪皮埃特洛(Louis DiPietro), 康奈爾大學
《巫師》是一款與現實融為一體的遊戲嗎?《模擬市民》屬於角色扮演遊戲嗎?來自世界各地的遊戲玩家或許對此持有不同的觀點,但正是這樣的思想多樣性,使得更好的演算法能夠幫助全球的受眾選擇合適的遊戲,根據康奈爾大學、Xbox 和微軟研究進行的新研究。
在超過 5,000 名遊戲玩家的幫助下,研究人員顯示,預測模型透過由來自不同國家的遊戲玩家標註的大規模資料集,提供比由單個國家的遊戲玩家標註的資料集更好的個性化遊戲推薦。該團隊的研究結果和相應的指南在遊戲領域以外具有廣泛的應用,為尋求跨國適用的資料標籤和更準確的預測人工智慧(AI)模型的研究人員和從業人員提供了指引。
康奈爾大學安·S·鮑爾斯計算和訊息科學學院訊息科學助理教授艾莉森·科尼克(Allison Koenecke)表示:“我們的研究表明,事實上透過多樣化進入預測模型的底層資料,你可以做得一樣好,甚至更好。”
資料標籤及文化差異對結果的影響
大資料集體用於推薦系統背後的預測模型。這些模型的精確度取決於底層資料,尤其是對於資料集中的每個個體元素的正確標註。研究人員和從業人員越來越多地依賴眾包工作者來進行標註工作,但眾包工作人員往往具有同質性。在這個資料標註階段,文化偏見可能進入並最終扭曲旨在為全球觀眾提供服務的預測模型,科尼克表示“對於演算程式中使用的資料集,某人仍然必須提出一些規則,或者對於對於某個資料點標註有某種方式的一些一般想法。這就是人性因素介入的地方,因為在這個過程中人類必須是決策者之一。”
該團隊對來自世界各地的 5,174 名 Xbox 遊戲玩家進行了調查,以幫助標註遊戲標題。他們被要求對自己玩過的遊戲應用標籤,如“舒適”,“奇幻”或“和平主義者”,並考慮不同因素,例如遊戲是否低複雜度或高複雜度以及遊戲控制方式的難易程度。某些遊戲標籤,如“禪”,用於描述寧靜、舒緩的遊戲,適用於不同國家;而其他的標籤,如一款遊戲是否“可重玩”,在不同國家進行標註時則有所不同。
為理解釋這些不一致性,研究團隊使用計算方法發現,遊戲玩家之間的文化差異以及某些標籤的翻譯和語言特色,都導致了不同國家的標註差異。接著,研究人員建立了兩個模型,可以預測來自每個國家的遊戲玩家如何標註某個遊戲,一個模型使用具有全球代表性的遊戲玩家的調查資料,另一個模型則使用僅來自美國遊戲玩家的調查資料。研究結果顯示,與僅來自美國遊戲玩家的標註模型相比,從全球多樣的人口中訓練出的模型在全球遊戲玩家中的預測能力提高了 8%。
全球包容性的審核指南
除了研究結果,研究人員還制定了一個指南框架,以指導其他研究人員和從業人員如何審核底層資料標籤,以確保全球包容性。科尼克表示:“公司往往使用同質性的資料標註者進行資料標註,而如果你想要打造一個全球產品,你肯定會遇到問題。透過我們的框架,任何學術研究人員或從業人員都可以審核他們自己的底層資料,看看他們是否因為資料標籤或選擇方面的問題而遇到代表性的問題。”
這項研究的結果和指南對於建立更具全球包容性的預測模型和人工智慧系統非常重要。在資料標註階段中處理文化差異和偏見,將幫助確保演算法能夠更好地為各個國家和文化的玩家提供遊戲推薦。同時這也有助於消除演算法資料中的不平等,使得人工智慧能夠更公正地反映多元文化社會的需求和偏好。
延伸閱讀
- Carv 完成 1000 萬美元 A 輪融資,協助遊戲玩家實現資料商品化
- 「遊戲玩家們紛紛湧至 Palworld 玩「搶槍寶可夢」,儘管存在版權疑慮」
- Forge 籌集 1100 萬美元, 為遊戲玩家解鎖獎勵
- 遊戲玩家揭露演算法資料中的差異
- 使用 HVAC 算法,為建築物住戶提供舒適體感同時減少碳排放
- 亞馬遜的「神祕計畫 Nessie」算法是什麼?
- 即將在歐洲推出的 TikTok「For You」流程將不再受到算法的影響
- Keychron Lemokey L3:專為遊戲玩家打造的高級鍵盤
- 讓人工智慧中的算法更貼近人類:科學家使用腦部成像技術來測試有關複雜決策的想法
- 遊戲玩家自動化機器人表現得像個「不理性」的人