Google 確認正在使用刮取的網路資料培訓 Bard 人工智慧
根據最新的隱私政策更新,Google 確認其將刮取的網路資料用於培訓 Bard 和 Cloud AI 等人工智慧服務。這一舉動引發了關於資料使用和隱私保護的討論。
Google 的隱私政策更新
根據 2023 年 7 月 1 日的更新,Google 的隱私政策表示公司將使用公開可得的訊息來改進其服務並開發新的產品、功能和技術,其中包括 Google 翻譯、Bard 和 Cloud AI 等功能。這意味著 Google 可以使用刮取的網路資料進行訓練和建模。
然而隱私政策並未具體說明公司將如何防止使用具有版權的材料。許多公開可存取的網站都有相應的政策,禁止將其資料用於訓練大規模語言模型和其他人工智慧工具集。這也引發了有關 Google 在資料收集和使用方面是否違反 GDPR 等全球法規的問題。
AI 公司的資料收集和使用問題
AI 公司如 OpenAI 的 GPT-4 已不願透露其訓練資料的來源,並且是否包含社交媒體帖子或人類藝術家和作家的版權作品。這種情況讓人們對「合理使用原則」是否適用於這種應用程式產生了疑問。不確保性已引發各種訴訟,並促使一些國家的立法者推出更嚴格的法律,以更好地規範 AI 公司的訓練資料收集和使用方式。
資料處理和 AI 系統的問題
這些資料的處理方式也引發了相關的問題,包括如何確保資料不會導致 AI 系統出現危險故障。負責整理這些龐大的訓練資料的人員通常需要長時間和極端的工作條件,這也是一個值得關注的問題。
挑戰和爭議
美國最大的報紙發行商 Gannett 正在對 Google 及其母公司 Alphabet 提起訴訟,指稱 AI 技術的發展幫助 Google 在數位廣告市場上獲得壟斷地位。與此同時 Google 的 AI 搜尋測試版等產品也被指稱為「抄襲引擎」,並因為導致網站流量減少而受到批評。Twitter 和 Reddit 等社交平臺最近也採取了嚴格措施,以防止其他公司自由地收集其資料。但相應的 API 變更和約束已引起了社區的抵制,因為這些變更對 Twitter 和 Reddit 的核心使用者體驗產生了負面影響。
總結
Google 確認使用刮取的網路資料來培訓其 AI 系統引發了許多問題和爭議。隨著全球法規的不斷完善以及市場競爭的加劇,AI 公司在收集和使用訓練資料方面面臨著更多的挑戰。如何處理這些資料以確保其不導致危險故障以及保護使用者的隱私和資料安全,是 AI 技術發展的重要課題。
延伸閱讀
- 開放 AI (OpenAI)的 ChatGPT 新聞發布:我們當前所知道的事情
- OpenAI 考慮允許 AI 色情內容?
- Google 為 Android 打造了一些最早期的社交應用程式,包括 Twitter 和其他應用
- OpenAI 揭開 AI 祕密指令的面紗
- AI 助您創辦者更快、更輕鬆地籌集資金嗎?
- Google 為 iPhone 使用者帶來「圈選搜尋」新變化
- Google 錢包正式登陸印度市場
- Google 新推出預算款 Pixel 8a,更新硬體配置,售價 499 美元
- Alphabet 旗下 Intrinsic 將 Nvidia 技術融入機器人平臺
- 本週人工智慧大事記:生成式人工智慧與創作者補償的問題