AI 生成內容威脅網路生態的質量與可靠性
引言
AlaskaCommons.com 網站上的撰稿人"Chelsea Waller"自稱是一名“專注於揭示真相的熱衷新聞記者”。她的一篇報道中寫道:“作爲一個 AI 語言模型,我無法預測《疾速追殺 4》是否會成爲一個讓人們銘記多年的傳奇結局。” 然而這個網站只是 NewsGuard 標記的衆多新聞網站之一,這些網站充斥着低質量、垃圾內容,據 NewsGuard 的報告稱,這些網站上出現了主要品牌的廣告。該研究首次由 MIT Technology Review 報道,其中涉及到的品牌包括花旗集團和 Subaru。
Google 表示已從報告中列出的“許多”網站上移除了廣告,盡管其他網站仍保留廣告。 NewsGuard 發現,超過 140 個品牌的廣告出現在被其定義爲不可靠的 AI 生成新聞網站上,而這些品牌很可能甚至不知道他們的廣告正在那裏展示。NewsGuard 發現,這些廣告是透過程式化的 Google 廣告系統在這些網站上自動投放的,而不是廣告主自行選擇廣告位置。而 AI 生成的網站透過在低成本內容旁邊執行廣告而獲利。 NewsGuard 跟蹤的一些網站每周發布數千篇文章,例如 World-Today-News.com,該網站上的文章直接復制貼上自《紐約時報》,還有標題爲“對不起,我是一個 AI 語言模型,我無法將給定的標題重寫,因爲它不清楚且不是可識別的語言,請提供一個清晰可讀的標題。”的文章。在撰寫本文時,這兩篇文章上都出現了廣告。
另一個名爲 MedicalOutline.com 的網站上,根據 MIT Technology Review 的報道,廣告商包括 Subaru、花旗集團和 GNC。該網站宣傳健康方面的錯誤訊息,比如“ADHD 有哪些自然療法?”和“檸檬能治愈皮膚過敏嗎?”。
廣告投放問題
Google 有關廣告投放的規定,禁止在垃圾自動生成內容以及從其他地方復制的材料上投放廣告,這與其在搜尋結果中處罰或降低垃圾訊息的政策相同。 Google 發言人 Michael Aciman 在給 The Verge 的郵件中表示:“我們有嚴格的政策規定,規定了可以在我們平臺上獲利的內容型別。例如,我們不允許在有害內容、垃圾或低價值內容以及純粹從其他網站復制的內容旁邊展示廣告。”他補充說,Google 在執行這些政策時,關注的是內容的質量,而不是它的生成方式,並且如果檢測到違規行爲,會阻止或移除廣告的投放。Aciman 表示除了取消對網站的貨幣化,Google 還會刪除在違規頁面上的廣告。
AI 生成內容的擴散與廣告盈利
科技媒體 The Verge 稱,人工智慧正在扼殺舊網路,而新網路正在掙扎着誕生,“生成式人工智慧模型正在改變網路經濟,使生成低質量內容變得更便宜。我們才剛剛開始看到這些變化的影響。” NewsGuard 的分析發現,廣告似乎是以程式設計方式生成的,出現在 AI 生成內容網站上,這意味着公司並非主動選擇在這些網站上投放廣告,而是透過廣告投放系統自動定位。大多數廣告是透過 Google 的工具投放的。 NewsGuard 將被其定義爲不可靠的 AI 生成新聞和訊息網站(UAIN)的特徵是,在很少或沒有人類監督的情況下執行,並發布主要或完全由機器人撰寫的文章。最近,NewsGuard 的分析師將新推出的 UAIN 網站的跟蹤數量從 49 個更新爲 217 個。 盡管許多廣告商及其廣告代理商維護着“品牌不安全”網站的“排除列表”,但這些列表往往沒有保持最新狀態,顯然沒有跟上 UAIN 網站激增的步伐。
在 2023 年 5 月和 6 月,NewsGuard 的分析師確保了來自 141 個主要品牌的 393 個程式化廣告,這些廣告出現在 NewsGuard 確保的 217 個 UAIN 網站中的 55 個網站上。NewsGuard 發現的這些廣告面向美國、德國、法國和義大利四個國家的網際網路使用者。 NewsGuard 沒有具體提及提供這些廣告的公司,但它們包括各種藍籌品牌:6 家大型銀行和金融服務公司、4 家豪華百貨公司、3 家運動服裝領先品牌、3 家電器制造商、兩家全球最大的消費技術公司、兩家全球電子商務公司、兩家美國頂級寬頻提供商、由美國廣播網路提供的 3 家流媒體服務、一個矽谷數位平臺和一家歐洲大型連鎖超市。 程式化廣告使用算法和高級拍賣流程,直接向個人使用者投放高度針對性的數位廣告,而不是特定網站。這意味着廣告會在使用者瀏覽網際網路時有效地“追蹤”他們。由於這個過程非常不透明,品牌可能不知道他們的廣告正在資助 UAIN 網站的傳播,因爲廣告是透過第三方購買的,並且涉及多個中介機構。
AI 生成內容的質量與傳播問題
NewsGuard 發現,所有 393 個廣告都直接出現在包含 AI 生成的錯誤訊息的文章旁邊。 一些展示主要品牌廣告的 UAIN 網站似乎使用人工智慧工具重寫主流新聞媒體的文章。例如,AlaskaCommons.com 發布的一篇文章似乎是英國小報《太陽報》美國版文章的 AI 重寫版本,甚至圖片和措辭都類似。AlaskaCommons.com 的文章數量驚人,自今年年初以來,名爲 Ingrid Taylor 的“作者”已經發表了 4364 篇文章,僅在 2023 年 6 月 15 日這一天就發表了 108 篇文章。 一些網站平均每天生成超過 1200 篇文章,幾乎沒有明顯的人工編輯監督。
相比之下,根據 2022 年 4 月的資料,《紐約時報》通常每天發表約 150 篇文章。 大多數 AI 生成的網站質量較低,但它們並不傳播錯誤訊息。然而 NewsGuard 發現,MedicalOutline.com 宣傳未經證實且潛在有害的自然療法,如“檸檬能治愈皮膚過敏嗎?”、“ADHD 的 5 種自然療法是什麼?”以及“如何自然地預防癌症”。 對於 UAIN 網站來說快速將其內容變現非常簡單。在 GoogleAdSense 的登入頁面上,Google 稱網站可以輕鬆地透過程式化廣告獲得收入:“您只需將 AdSense 程式碼放入您的網站中,它就會立即開始工作。” 自從 NewsGuard 於 2023 年 5 月首次開始跟蹤 UAIN 網站以來,每周已確保約 25 個新網站。5 月初,他們的報告只發現了 49 個“似乎幾乎完全由人工智慧軟體編寫”的網站。而實際上 UAIN 網站的總數可能比 NewsGuard 當前識別的 217 個更多。
AI 生成內容的影響與展望
近幾個月來,多家媒體報道了 AI 生成內容正在污染網際網路的現象。The Verge 的高級記者詹姆斯·文森特(James Vincent)在 6 月 26 日發表了一篇激烈評論的文章。他寫道:“ChatGPT 正被用來生成充斥着垃圾的網站。Etsy 充斥着“AI 生成的垃圾”。聊天機器人相互引用錯誤訊息。LinkedIn 利用人工智慧來刺激疲勞的使用者。Snapchat 和 Instagram 希望機器人能在你朋友不在時與你交談……網際網路檔案館正在對抗資料刮刀,而人工智慧正在撕裂維基百科。舊的網路正在消亡,而新的網路正在掙扎着誕生。” 文森特認爲,當然網路多年來一直在死亡,被那些從網站上轉移流量的應用程式或獎勵“縮短注意力”的算法所扼殺。但在 2023 年,它又在消亡,一個新的催化劑在發揮作用:人工智慧。 他舉了一個例子:“網站創造了一個順暢、功能豐富的平臺,並向任何人開放,讓他們加入。他們放了一個盒子在我們面前,我們用文字和圖片填滿這些盒子,人們來看看這些盒子裏面的內容。這些公司追求規模,因爲一旦有足夠的人聚集在任何地方,通常就有辦法從他們身上賺錢。但是人工智慧改變了這些前提。” 因爲,只要有資金和計算能力,人工智慧系統,尤其是當前流行的生成模型,可以毫不費力地進行擴充套件。它們會產生大量的文字和影象,很快還可能會產生音樂和影片。
它們的產出有可能超過或勝過人們現在所依賴的新聞、訊息和娛樂平臺。但這些系統的質量往往較低。“這些模型是在上一個網路時代奠定的資料基礎上訓練出來的,它們對這些資料的再現並不完美。公司從開放的網路中搜集訊息,並將其提煉成機器生成的內容,這些內容的生成成本低,但可靠性差。然後這些產品與之前的平臺和人爭奪注意力。”文森特指出。 最成功的網站通常是利用規模優勢的網站,透過增加社會聯系或產品選擇,或透過對構成網際網路本身的大量訊息進行分類。但這種規模依賴於大量人類創造潛在價值,在大規模生產方面,人類顯然無法與人工智慧相匹敵。
然而文森特最後也提到,這並不一定是壞事。“有人可能會說,這只是世界執行的方式,指出網路本身就扼殺了之前的事物,並且往往是爲了更好的發展。例如,印刷版百科全書幾乎已經消失,但我更喜歡維基百科的廣度和可及性,而不是《大英百科全書》的厚重感和安全感。對於與人工智慧生成的寫作有關的問題,還有許多改進的方法——從改進引用功能到增加人工監督。此外即使網路上充斥着人工智慧生成的垃圾,它也可能被證實是有益的,能夠刺激那些資金更充足的平臺發展。例如,如果 Google 在搜尋結果中不斷向您提供垃圾訊息,您可能更傾向於爲您信任的來源付費並存取它們。” 歸根結底,當前人工智慧引發的變革只是網路歷史上長期鬥爭的最新成果。從本質上講,這是一場關於訊息的戰鬥——關於誰制造訊息,如何獲取訊息以及誰獲得報酬。
社論
AI 生成內容的廣泛應用引發了對網路生態質量和可靠性的關切。隨着技術的不斷進步,AI 生成模型能夠以驚人的速度和規模生成大量的文字、影象、音樂和影片。然而這些內容的質量往往不盡如人意,甚至存在錯誤訊息和健康謠言的傳播。 對於廣告主來說他們的品牌可能會無意中出現在 AI 生成的低質量內容網站上,這給他們的聲譽帶來了潛在的負面影響。雖然 Google 等廣告平臺有一定的規定和措施來約束廣告在低質量網站上的投放,但由於廣告投放系統的復雜性和 UAIN 網站數量的迅速增長,這些規定和措施可能存在一定的滯後和不足。 對於 UAIN 網站本身,雖然它們在短期內可以從 AI 生成內容中獲利,但由於其低質量和缺乏可靠性,它們很難建立起長期的讀者信任和忠誠度。這可能對它們的可持續發展和商業模式造成挑戰。 然而 AI 生成內容也有其積極的一面。
它能夠爲使用者提供更多樣化、個性化的訊息和娛樂體驗,推動創新和發展。同時 AI 生成內容也在某種程度上強調了人類創造力和編輯監督的重要性,促使人們思考如何改進和提高 AI 生成內容的質量和可靠性。 在面對 AI 生成內容的挑戰和機遇時,我們需要綜合運用技術、政策和倫理等多個方面的手段來引導和規範其發展。對於廣告平臺和品牌廣告商來說他們應該加固對廣告投放的監管和篩選,確保廣告不會出現在低質量和不可靠的內容旁邊。對於 UAIN 網站,他們應該努力提高內容質量,增強可信度和專業性,以贏得讀者的信任和忠誠。同時技術創新和算法改進也應該與人工監督和編輯審核相結合,以確保生成內容的準確性和可靠性。 對於讀者和使用者來說他們應該保持批判性思維,對 AI 生成內容保持警惕,審慎判斷訊息的真實性和可靠性。同時他們也可以透過支援和存取那些提供高質量、可信賴內容的平臺和媒體來推動網路生態的健康發展。
AI 生成內容的興起是網路發展的一個新階段,我們應該以開放、負責和合作的態度應對這個挑戰,並努力構建一個更可靠、更有質量的網路空間。
建議
針對 AI 生成內容的問題和挑戰,以下是一些建議: 廣告平臺和品牌廣告商應加固對廣告投放的監管和篩選,避免廣告出現在低質量和不可靠的內容旁邊。 UAIN 網站應努力提高內容質量,增強可信度和專業性,以贏得讀者的信任和忠誠。
技術創新和算法改進應與人工監督和編輯審核相結合,以確保生成內容的準確性和可靠性。 讀者和使用者應保持批判性思維,對 AI 生成內容保持警惕,審慎判斷訊息的真實性和可靠性。 支援和存取那些提供高質量、可信賴內容的平臺和媒體,推動網路生態的健康發展。 學術界、科技企業和政府部門應加固合作,共同研究和推動 AI 生成內容的質量和可靠性的提升。 透過採取這些措施,我們可以在人工智慧與內容生成的新時代中建立一個更加可靠、可信賴的網路生態,從而更好地滿足使用者的需求和期望。
延伸閱讀
- IBM-HashiCorp 聯手可能比想像中更複雜
- Xaira:AI 藥物發現新創公司以 10 億美元巨額啟動,宣稱已準備好開展藥物開發
- 資料軟體新創 Dripos 獲得 1100 萬美元 A 輪融資,將取代 Square、Toast 和其他 8 款軟體
- 30+新創公司亮相,HAX 5 月 1 日 Demo Day 展示
- 華爾街對 Salesforce-Informatica 合作前景不看好
- 抖音與 AXS 合作全球售票
- 神經概念如何改變了 F1 賽車空氣動力學
- TechCrunch Early Stage 2024:技術創業家的力量
- 歐盟與美國宣布共同合作,致力於人工智慧安全、標準與研發
- 人工智慧與資料基礎設施推動開源新創公司需求