紐約時報禁止使用其內容來訓練人工智慧模型
背景
近日紐約時報更新了其服務條款,禁止使用其內容來訓練人工智慧模型,並指出拒不遵守這些約束可能會受到不明確的罰款或處罰。這個舉措是紐約時報提前採取的措施,旨在阻止其內容被用於訓練人工智慧模型。
紐約時報的約束措施
根據紐約時報的最新條款,自 8 月 3 日起,任何使用紐約時報的內容包括文字、照片、影像、音訊/影片片段、“外觀感知”、“後設資料”或編輯之集合,在開發“任何軟體程式,包括但不限於訓練機器學習或人工智慧系統”時,都將被禁止。此外使用自動化工具,如網站爬蟲,也需要取得紐約時報的書面許可。
紐約時報表示拒不遵守這些新約束可能會被處以不明確的罰款或處罰。 不過儘管引入了新規定,紐約時報似乎並未對其 robots.txt 檔案進行任何更改,該檔案通知搜尋引擎爬蟲可以存取哪些 URL。
背後的意義
值得注意的是,Google 最近允許自己使用從網路上收集的公開資料來訓練其人工智慧服務。此舉可能是對 Google 隱私政策的最新更新做出的回應,該政策披露了該搜尋巨頭可能從網路上收集公共資料來訓練其各種人工智慧服務,例如 Bard 或 Cloud AI。許多支援流行人工智慧服務的大型語言模型,如 OpenAI 的 ChatGPT,都是在可能包含版權或其他受保護材料的大型資料集上訓練而成的,而這些資料集通常是非原創作者未經許可從網路上抓取的。
確實,紐約時報在今年 2 月與 Google 簽署了一項價值 1 億美元的合作協議,允許 Google 在未來三年內在其平臺上展示紐約時報的內容。該出版物表示兩家公司將合作開發內容分發、訂閱、銷售、廣告和“實驗”工具,因此紐約時報的服務條款的變更可能針對的不僅僅是 OpenAI 或微軟等公司。
此外 OpenAI 最近宣布,網站運營者現在可以阻止其 GPTBot 爬蟲從其網站上取得資料。微軟還對其自己的服務條款進行了一些新的約束,禁止使用者使用其人工智慧產品“直接或間接地建立、訓練或改進任何其他人工智慧服務”,並禁止使用者從其人工智慧工具中爬取或提取資料。
對話與呼籲
這個問題引起了一些新聞機構的關注,包括美聯社和歐洲出版商協會,他們簽署了一封公開信,呼籲全球立法者在使用資料進行訓練之前,要求透明開放,並獲得權利持有人的同意。人們普遍關注使用資料訓練人工智慧模型時可能違反版權或其他智慧財產權的問題。
結語
紐約時報禁止使用其內容來訓練人工智慧模型的決定引起了人們對於智慧財產權、資料擁有權和資料使用責任的關注。這是一個引人深思的問題,需要法律和倫理方面的討論和解決。無論如何,這一決定無疑對人工智慧研究和應用領域產生了重要影響,並需要各方共同努力找到平衡點,尊重智慧財產權,同時推動人工智慧技術的發展。未來的立法和政策應該關注資料的合法使用、版權保護和透明度,以促進人工智慧的健康發展。
延伸閱讀
- 紐約時報遊戲推出“Wordle”檔案庫,提供超過 1000 個過往謎題
- Motional 宣布進行重組,延遲商用自駕車計畫
- Maven Ventures 宣布募得第四基金 6,000 萬美元,消費科技投資依舊熱烈
- Two Chairs 宣布完成 7200 萬美元 C 輪融資,積極擴充套件其治療師網路
- 瓦納計劃讓使用者出租 Reddit 資料以訓練人工智慧【AI】
- Roku 宣布第二次安全事件後,57.6 萬使用者帳戶遭入侵
- Modal 籌集 2500 萬美元,為企業員工提供資料與人工智慧訓練
- MrBeast 與 Prime Video 宣布「史上最大的遊戲秀」
- 峯值 XV 宣布推出永續基金,由自有合作夥伴和其他領導者支援
- NFT 平臺 Zora 提供了一種新的賺錢方式,適合 AI 模型製作者