屬性增強的標籤整合方法:提升群眾外包的品質與模型品質
簡介
群眾外包是一種有效且低成本的方式,可以從群眾工作者那裡收集標籤。然而由於缺乏專業知識,群眾外包的標籤品質相對較低。解決這個問題的常見方法是從不同的群眾工作者那裡收集每個實例的多個標籤,然後使用標籤整合方法來推斷其真實標籤。然而幾乎所有現有的標籤整合方法僅僅利用原始屬性訊息,並未關注每個實例的多個嘈雜標籤集的品質。 為理解決這些問題,由姜亮曉博士帶領的研究團隊在《Frontiers of Computer Science》上發表了他們的新研究。該團隊提出了一種全新的三階段標籤整合方法,稱為屬性增強的標籤整合(Attribute Augmentation-based Label Integration,簡稱 AALI)。AALI 透過提高原始屬性空間的區分能力以及識別每個實例的多個嘈雜標籤集的品質,提升了標籤整合的效能。在模擬和真實世界的群眾外包資料集上的實驗結果表明,AALI 在標籤品質和模型品質方面優於所有其他最先進的競爭對手。方法
在研究中,他們設計了一種屬性增強方法來豐富屬性空間,然後開發了一個過濾器,以從群眾外包資料集中挑選出具有高品質多個嘈雜標籤集的可靠實例。最後他們使用交叉取證在可靠實例上構建多個組分分類器,以預測所有實例。 具體而言,在第一階段中,AALI 將從多個嘈雜標籤集生成的類成員機率定義為新屬性,並透過將原始屬性與新屬性存取起來構建擴充屬性空間。在第二階段,AALI 開發了一個過濾器,以選出具有高品質多個嘈雜標籤集的可靠實例。結果,原始資料集被劃分為可靠資料集和不可靠資料集。在第三階段中,AALI 使用多數投票來初始化可靠資料集中所有實例的整合標籤,同時估計每個整合標籤的確保性並將其分配給每個實例的權重。接下來,AALI 使用 K 折交叉取證在可靠資料集上構建 M 個組分分類器,以預測所有實例的類別機率分布。最後 AALI 更新可靠資料集中每個實例的整合標籤,並將整合標籤分配給不可靠資料集中的每個實例。 在模擬和真實世界的群眾外包資料集上的廣泛實驗結果取證了 AALI 的優越性。討論與展望
這項研究的成果為解決群眾外包中標籤品質較低的問題提供了新的方法和思路。透過擴充屬性空間和過濾可靠實例,AALI 能夠提高標籤整合的品質和模型的品質,從而更準確地推斷實例的真實標籤。 未來的研究可以集中在使用最佳化方法找到發展的過濾器閾值的最佳值。同時研究人員還可以探索如何擴充套件 AALI 方法以應對更複雜的群眾外包場景以及如何進一步提高標籤整合的效果和效率。結論
群眾外包為我們收集標籤提供了一種有效且低成本的方式。然而由於群眾工作者的專業知識不足,群眾外包的標籤品質較低。姜亮曉博士領導的研究團隊在《Frontiers of Computer Science》發表了一項新研究,提出了一種名為屬性增強的標籤整合方法(AALI),以解決這個問題。研究結果表明,AALI 在標籤品質和模型品質方面優於其他競爭對手。 這項研究為我們理解如何提升群眾外包的品質提供了重要的洞察力。未來的研究可以進一步完善 AALI 方法,以應對更複雜的群眾外包場景,從而提高標籤整合的效果和效率。Crowdsourcing-wordpress,屬性增強,標籤整合,群眾外包方法
延伸閱讀
- Glow 修復漏洞,保護使用者個人資料
- Quora 推出 AI 聊天機器人創作者經濟,讓人引頸期盼!
- Gracy Chen:《加密每日與 Bitget 董事總經理 Gracy Chen 座談》
- 水形遊戲推出 HeadCoach 實時教練 AR 遊泳眼鏡
- 山姆·班克曼-弗裏德站臺上需要更好的回答
- Weav 突圍而出,為企業提供即插即用的 AI 副駕駛員
- Weav 入侵隱匿,為企業提供即插即用的 AI 同乘員
- DistroKid 使用者現可將歌曲上傳至 TikTok 音樂和 CapCut!
- 檢視問題<question> + Yuzu 打算讓保險公司混搭福利以降低健康計畫費用
- 【首個美洲先行者:Solana 的 SOL 在十月大漲 50%】