
紐約時報禁止使用其內容來訓練人工智慧模型
背景
近日紐約時報更新了其服務條款,禁止使用其內容來訓練人工智慧模型,並指出拒不遵守這些約束可能會受到不明確的罰款或處罰。這個舉措是紐約時報提前採取的措施,旨在阻止其內容被用於訓練人工智慧模型。
紐約時報的約束措施
根據紐約時報的最新條款,自 8 月 3 日起,任何使用紐約時報的內容包括文字、照片、影像、音訊/影片片段、“外觀感知”、“後設資料”或編輯之集合,在開發“任何軟體程式,包括但不限於訓練機器學習或人工智慧系統”時,都將被禁止。此外使用自動化工具,如網站爬蟲,也需要取得紐約時報的書面許可。
紐約時報表示拒不遵守這些新約束可能會被處以不明確的罰款或處罰。 不過儘管引入了新規定,紐約時報似乎並未對其 robots.txt 檔案進行任何更改,該檔案通知搜尋引擎爬蟲可以存取哪些 URL。
背後的意義
值得注意的是,Google 最近允許自己使用從網路上收集的公開資料來訓練其人工智慧服務。此舉可能是對 Google 隱私政策的最新更新做出的回應,該政策披露了該搜尋巨頭可能從網路上收集公共資料來訓練其各種人工智慧服務,例如 Bard 或 Cloud AI。許多支援流行人工智慧服務的大型語言模型,如 OpenAI 的 ChatGPT,都是在可能包含版權或其他受保護材料的大型資料集上訓練而成的,而這些資料集通常是非原創作者未經許可從網路上抓取的。
確實,紐約時報在今年 2 月與 Google 簽署了一項價值 1 億美元的合作協議,允許 Google 在未來三年內在其平臺上展示紐約時報的內容。該出版物表示兩家公司將合作開發內容分發、訂閱、銷售、廣告和“實驗”工具,因此紐約時報的服務條款的變更可能針對的不僅僅是 OpenAI 或微軟等公司。
此外 OpenAI 最近宣布,網站運營者現在可以阻止其 GPTBot 爬蟲從其網站上取得資料。微軟還對其自己的服務條款進行了一些新的約束,禁止使用者使用其人工智慧產品“直接或間接地建立、訓練或改進任何其他人工智慧服務”,並禁止使用者從其人工智慧工具中爬取或提取資料。
對話與呼籲
這個問題引起了一些新聞機構的關注,包括美聯社和歐洲出版商協會,他們簽署了一封公開信,呼籲全球立法者在使用資料進行訓練之前,要求透明開放,並獲得權利持有人的同意。人們普遍關注使用資料訓練人工智慧模型時可能違反版權或其他智慧財產權的問題。
結語
紐約時報禁止使用其內容來訓練人工智慧模型的決定引起了人們對於智慧財產權、資料擁有權和資料使用責任的關注。這是一個引人深思的問題,需要法律和倫理方面的討論和解決。無論如何,這一決定無疑對人工智慧研究和應用領域產生了重要影響,並需要各方共同努力找到平衡點,尊重智慧財產權,同時推動人工智慧技術的發展。未來的立法和政策應該關注資料的合法使用、版權保護和透明度,以促進人工智慧的健康發展。
延伸閱讀
- Google 攜手 Anthropic 推出全新 AI 模型存取資料標準,革命性進展即將改變科技界!
- 「Inception 首度曝光!全新 AI 模型顛覆科技界!」
- 《Anthropic 利用寶可夢測試最新 AI 模型,成果驚人!》
- Google 悄然推出下一代旗艦 AI 模型,科技界即將震撼!
- AI2 推出新 AI 模型,成功超越 DeepSeek 最佳技術!
- 馬克·祖克柏批準 Meta Llama 團隊開啟版權作品訓練,引發法律爭議!
- xAI 新一代 AI 模型遲遲未發,背後隱藏的趨勢曝光!
- Google 執行長宣布:AI 模型 Gemini 將成為 2025 年最大焦點!
- 「DeepSeek 最新 AI 模型為何自認是 ChatGPT?揭祕背後的技術奧妙!」
- DeepSeek 推出新 AI 模型,成為最佳「開放挑戰者」!