社交媒體巨頭們被敦促解決資料抓取的隱私風險

社交媒體巨頭被敦促解決資料抓取隱私風險國際隱私監管機構籲各主流社交媒體平臺保護使用者的公開帖子免受資料抓取的侵害國際隱私監管機構，包括英國的 ICO、加拿大的 OPC 和香港的 OPCPD 在內的十幾個隱私監管機構聯合簽署了一份宣告，敦促主流社交媒體平臺保護使用者的公開帖子免受資料抓取的侵害，並警告 .... (往下繼續閱讀)

by 江塵
2023/8/25
10 分鐘閱讀時間

A- A A+

文章目錄

社交媒體巨頭被敦促解決資料抓取隱私風險

國際隱私監管機構籲各主流社交媒體平臺保護使用者的公開帖子免受資料抓取的侵害

國際隱私監管機構，包括英國的 ICO、加拿大的 OPC 和香港的 OPCPD 在內的十幾個隱私監管機構聯合簽署了一份宣告，敦促主流社交媒體平臺保護使用者的公開帖子免受資料抓取的侵害，並警告他們在大多數市場上必須承擔相應的法律責任。宣告中指出：“在大多數司法管轄區，網路上‘公開提供’、‘公開可存取’或‘公共性質’的個人訊息都受到資料保護和隱私法的約束。因此資料抓取這些個人訊息的個人和公司要承擔確保其遵守這些和其他適用法律的責任。然而社交媒體公司和其他託管公共可存取個人訊息的網站的運營商（SMCs 和其他網站）在資料保護方面也有義務，這些義務通常適用於個人訊息，無論該訊息是否公開可存取。在許多司法管轄區，大規模的個人訊息資料抓取可能構成報告性資料泄露。”

潮流 AI 模型的崛起引發對資料抓取的關注

此次發表的宣告的時間恰逢對潮流 AI 模型的熱度不斷上升，這些模型通常需要大量資料來進行訓練，可能會鼓勵更多實體透過抓取網際網路資料集來參與潮流 AI 的競爭。像 OpenAI 的大型語言模型 ChatGPT 這樣的知名例子，至少部分地依賴於網路上發布的資料來訓練他們的系統。今年 6 月，CNN Business 報導了一起對 OpenAI 提起的集體訴訟，指控該公司祕密從網際網路上抓取了大量的個人資料。隱私監管機構所強調的隱私風險包括利用資料抓取進行針對性的網路攻擊，如社交工程和偽造身份；以及用於監測、個人概括和監視個人，例如使用資料填充人臉識別資料庫並提供未經授權的存取，這是對 Clearview AI 的直接抨擊，該公司面臨來自國際監管機構的多項執法行動（包括歐盟多個國家）。他們還警告說，抓取的資料可以被用於未經授權的政治或情報收集，包括外國政府或情報機構。此外這些資料還可以用於傳送不需要的直接銷售或垃圾郵件。

對 AI 模型培訓的潛在威脅

監管機構並未直接將 AI 模型的培訓列為這些“關鍵”的隱私風險之一，但在未獲知或未經同意的情況下，使用人們的資料訓練的生成式 AI 工具可能被重新用於他們所引用的多種惡意用途中，包括冒充個人進行針對性的網路攻擊、身份欺詐，或監控/監視個人。因此對於從事資料抓取的平臺而言，這份宣告向全球主流社交媒體平臺傳達了一個明確的訊息：就是在考慮保護人們的資料免受抓取侵害時，他們應當謹慎考慮各個司法管轄區內不同型別資料抓取的合法性，並採取措施來防止非法資料抓取。他們還強調：“抓取公開可存取資料並從中提取價值的技術不斷湧現和發展，資料安全是一項動態責任，保持警惕至關重要。由於沒有哪種保護措施能夠充分保護免受資料抓取可能引起的所有潛在隱私傷害，因此 SMCs 和其他網站應該實施多層次的技術和程式性控制來減輕風險。”

建議措施以減少資料抓取的風險

聯合宣告中提到的約束使用者資料受到抓取風險的建議措施包括：組建內部團隊/角色專注於資料抓取風險；對一個帳號對另一個帳號的存取進行“速率約束”，並在檢測到異常活動時約束存取；監測新帳號開始搜尋其他使用者的速度和積極性，並採取措施對異常活動作出回應。他們還建議平臺透過識別機器人活動中的模式來檢測抓取軟體，例如擁有檢測可疑 IP 位址活動的系統。對於識別機器人的措施包括使用 CAPTCHA 機制和封鎖已識別資料抓取活動的 IP 位址（盡管機器人可以解決 CAPTCHA，所以這個建議已經顯得有些過時）。

其他建議措施包括平臺對抓取資料的相關人採取適當的法律行動，例如傳送“停止和取消”信函；要求刪除被抓取的訊息；獲得已刪除的確認；採取其他法律行動來執行禁止資料抓取的條款和條件。監管機構還警告說，根據現行的資料泄露法，平臺可能還有通知受影響的個人和隱私監管機構的要求。這封信的收件人包括核心社交媒體巨頭的母公司，如 YouTube 的母公司 Alphabet、TikTok 的母公司 Bytedance、Meta（Instagram、Facebook 和 Threads 的所有者）、Microsoft（LinkedIn）、新浪公司（微博）和 X（即以前被稱為 Twitter 的平臺）

個人應長期思考保護自己的資料

宣告中還給出了一些建議，以幫助個人採取措施保護自己免受資料抓取的風險，包括注意平臺的隱私政策；仔細考慮自己選擇在網路上分享的訊息；並利用任何允許他們控制帖子可見性的設定。他們補充道：“最終我們鼓勵個人長遠思考。一個人對於他們今天分享的訊息，幾年之後會有什麼感受呢？儘管 SMCs 和其他網站可能提供刪除或隱藏訊息的工具，但如果訊息已被索引或抓取，並被進一步共享，同樣的訊息將永遠存在於網際網路上。”信中還敦促對於擔心自己的資料可能被“非法或不當”地抓取的個人聯絡相關的平臺或網站，如果他們未收到令人滿意的回復，建議他們向相應的資料保護機構投訴。因此監管機構鼓勵使用者對資料抓取更加警惕，這可能最終導致在這一領域的調查和執法活動上升。

國際監管機構的聯合宣告引起歐盟關注

十幾個簽署這份聯合宣告的國際監管機構都來自於歐盟以外的市場。但正如上文所述，歐盟的資料保護監管機構已經透過根據歐洲聯盟的《通用資料保護條例》（GDPR）提出的執法措施對資料抓取風險進行了積極的行動。他們也密切關注生成式 AI 服務的發展，因此宣告中提到的問題與歐盟的資料保護機構已經關注的問題基本上是一致的。值得注意的是，今年早些時候，義大利的隱私監管機構對 ChatGPT 提出了當地停止處理命令，這導致 OpenAI 匆忙釋出了訊息披露和控制措施。與一些其他地區相比，Google 的 Bard AI 聊天機器人在歐盟的推出過程中花費了較長時間，因爲它在愛爾蘭的主要歐盟隱私監管機構提出了相似的擔憂。但歐盟資料保護機構同時協調了如何最佳地將當地資料保護規則應用於這些新型 AI 聊天機器人的問題，包括就在 GDPR 框架下用於訓練模型的資料處理的合法性進行討論。因此關於像 ChatGPT 這樣的工具的合法性核心問題的決策在歐盟尚待確保。今年早些時候，法國的隱私監管機構 CNIL 還警告說，保護免受資料抓取的措施將成為其在 5 月份宣布的 AI 行動計劃的重要一環。

Privacy-社交媒體,資料抓取,隱私風險,社交媒體巨頭,解決方案

產品管理

專案管理

Web 3

AIGC

專案故事

專案工具

網路議題

閱讀心得

軟體測試

程式筆記

職涯觀點

日常生活

市場觀察

資料收集