產品管理

進行屬性增強型標籤整合的群眾外包方法

屬性增強的標籤整合方法:提升群眾外包的品質與模型品質簡介群眾外包是一種有效且低成本的方式,可以從群眾工作者那裡收集標籤。然而由於缺乏專業知識,群眾外包的標籤品質相對較低。解決這個問題的常見方法是從不同的群眾工作者那裡收集每個實例的多個標籤,然後使用標籤整合方法來推斷其真實標籤。然而幾乎所有現有的標籤 .... (往下繼續閱讀)

分享到 Facebook 分享到 Line 分享到 Twitter

文章目錄

進行屬性增強型標籤整合的群眾外包方法

屬性增強標籤整合方法:提升群眾外包的品質與模型品質

簡介

群眾外包是一種有效且低成本的方式,可以從群眾工作者那裡收集標籤。然而由於缺乏專業知識,群眾外包的標籤品質相對較低。解決這個問題的常見方法是從不同的群眾工作者那裡收集每個實例的多個標籤,然後使用標籤整合方法來推斷其真實標籤。然而幾乎所有現有的標籤整合方法僅僅利用原始屬性訊息,並未關注每個實例的多個嘈雜標籤集的品質。 為理解決這些問題,由姜亮曉博士帶領的研究團隊在《Frontiers of Computer Science》上發表了他們的新研究。該團隊提出了一種全新的三階段標籤整合方法,稱為屬性增強標籤整合(Attribute Augmentation-based Label Integration,簡稱 AALI)。AALI 透過提高原始屬性空間的區分能力以及識別每個實例的多個嘈雜標籤集的品質,提升了標籤整合的效能。在模擬和真實世界的群眾外包資料集上的實驗結果表明,AALI 在標籤品質和模型品質方面優於所有其他最先進的競爭對手。

方法

在研究中,他們設計了一種屬性增強方法來豐富屬性空間,然後開發了一個過濾器,以從群眾外包資料集中挑選出具有高品質多個嘈雜標籤集的可靠實例。最後他們使用交叉取證在可靠實例上構建多個組分分類器,以預測所有實例。 具體而言,在第一階段中,AALI 將從多個嘈雜標籤集生成的類成員機率定義為新屬性,並透過將原始屬性與新屬性存取起來構建擴充屬性空間。在第二階段,AALI 開發了一個過濾器,以選出具有高品質多個嘈雜標籤集的可靠實例。結果,原始資料集被劃分為可靠資料集和不可靠資料集。在第三階段中,AALI 使用多數投票來初始化可靠資料集中所有實例的整合標籤,同時估計每個整合標籤的確保性並將其分配給每個實例的權重。接下來,AALI 使用 K 折交叉取證在可靠資料集上構建 M 個組分分類器,以預測所有實例的類別機率分布。最後 AALI 更新可靠資料集中每個實例的整合標籤,並將整合標籤分配給不可靠資料集中的每個實例。 在模擬和真實世界的群眾外包資料集上的廣泛實驗結果取證了 AALI 的優越性。

討論與展望

這項研究的成果為解決群眾外包中標籤品質較低的問題提供了新的方法和思路。透過擴充屬性空間和過濾可靠實例,AALI 能夠提高標籤整合的品質和模型的品質,從而更準確地推斷實例的真實標籤。 未來的研究可以集中在使用最佳化方法找到發展的過濾器閾值的最佳值。同時研究人員還可以探索如何擴充套件 AALI 方法以應對更複雜的群眾外包場景以及如何進一步提高標籤整合的效果和效率。

結論

群眾外包為我們收集標籤提供了一種有效且低成本的方式。然而由於群眾工作者的專業知識不足,群眾外包的標籤品質較低。姜亮曉博士領導的研究團隊在《Frontiers of Computer Science》發表了一項新研究,提出了一種名為屬性增強標籤整合方法(AALI),以解決這個問題。研究結果表明,AALI 在標籤品質和模型品質方面優於其他競爭對手。 這項研究為我們理解如何提升群眾外包的品質提供了重要的洞察力。未來的研究可以進一步完善 AALI 方法,以應對更複雜的群眾外包場景,從而提高標籤整合的效果和效率。
Crowdsourcing-wordpress,屬性增強,標籤整合,群眾外包方法
程宇肖

程宇肖

Reporter

大家好!我是程宇肖,我對於科技的發展和應用有著濃厚的興趣,並致力於將最新的科技趨勢和創新帶給大家。科技領域的變化速度驚人,每天都有令人興奮的新發現和突破。作為一名部落格作者,我將帶領大家深入探索科技的奧秘和應用的無限可能。