據報導，新聞媒體指責 Perplexity 涉嫌抄襲和不道德的網頁抓取

新聞媒體指控 Perplexity 涉及抄襲和不道德網頁抓取在這個生成式人工智慧的時代，聊天機器人可以根據網路內容提供詳細答案的能力，公平使用和抄襲之間的界線以及常規網頁抓取和不道德總結之間的界線變得十分微弱。Perplexity AI 是一家將搜尋引擎與大型語言模型相結合的新創企業，能夠生成詳細的 .... (往下繼續閱讀)

by 程宇肖
2024/7/3
4 分鐘閱讀時間

A- A A+

文章目錄

新聞媒體指控 Perplexity 涉及抄襲和不道德網頁抓取

在這個生成式人工智慧的時代，聊天機器人可以根據網路內容提供詳細答案的能力，公平使用和抄襲之間的界線以及常規網頁抓取和不道德總結之間的界線變得十分微弱。Perplexity AI 是一家將搜尋引擎與大型語言模型相結合的新創企業，能夠生成詳細的回答，而不僅僅是提供連結。然而 2024 年 6 月的一系列指控暗示了該新創企業的做法邊緣化。

版權法和 AI 網路爬蟲的模糊性

爭議的核心在於兩個概念的細微差異。一個是機器人排除協議，這是網站用於指示不希望其內容被網路抓取機器人存取的標準。另一個是版權法中的公平使用，這為在某些情況下允許無需許可或支付使用受版權保護的材料建立了法律框架。

祕密抓取網路內容

《Wired》於 6 月 19 日的報導聲稱 Perplexity 無視機器人排除協議，祕密抓取網站的某些區域，這是出版商不希望機器人存取的部分。Perplexity 否認了這一指控，並聲稱他們遵守了版權法中的公平使用規定。

抄襲還是公平使用？

除了被指控祕密抓取網路內容外，Perplexity 還面臨抄襲指控。《Wired》和《福布斯》都指控 Perplexity 抄襲其文章。《福布斯》聲稱 Perplexity 的某些文章與其原創報導幾乎相同，而 Perplexity 則辯稱提供文章摘要屬於公平使用的範疇。

在這個情況下，法院將權衡摘要是否使用了原始文章的大量表達方式以及摘要是否可能成為替代閱讀原文。然而遺憾的是，除非 Perplexity 使用了完整的表達方式（而在某些情況下，它確實有這樣做），否則它的摘要可能不會被視為違反公平使用規則。

Perplexity 如何保護自己

與 Perplexity 類似的其他聊天機器人也帶來了同樣的問題。如果人工智慧抓取器繼續將出版商的作品拿去自用，出版商將更難賺取廣告收入，從而導致更少的內容可供抓取。如果沒有足夠的內容可供抓取，生成式人工智慧系統將轉向以合成資料進行訓練，這可能導致一個可怕的負面迴圈。

Perplexity 等 AI 公司正努力與出版商簽訂廣告收益分享協議，並提供技術讓出版商能夠在其網站和產品內部構建問答體驗。然而這些舉措是否僅僅是對系統性智慧財產權盜用的掩飾還有待觀察。

News-media-Perplexity,抄襲,不道德,新聞媒體,網頁抓取

產品管理

專案管理

Web 3

AIGC

專案故事

專案工具

網路議題

閱讀心得

軟體測試

程式筆記

職涯觀點

日常生活

市場觀察

資料收集