科技公司的尷尬戰爭:算法的“好意” 險些毀一位父親的人生


傢住舊金山的馬克怎麼都沒想到,本來急著給自己兒子看病,給醫生發一張照片,結果卻讓自己險些身敗名裂。事情發生在去年年初,由於當時仍處在疫情高峰期,一些非緊急醫療機構都關閉服務,也包括馬克傢選擇的兒童診所。馬克發現自己兒子的私處出現腫脹,急忙尋求專業人士的幫助,和醫生打視頻電話。

在視頻之前,護士讓馬克發一張照片給醫生看下。馬克照做。

然而讓他沒想到的是,這張照片可給他惹大禍。

/ 愛子心切的父親,算法眼中的“戀童癖” /

在照片發出的兩天後,馬克突然接到Google的一紙通知。

由於涉嫌儲存和傳播有害內容,嚴重違反用戶協議和公司政策,並且涉嫌違法,他的Google賬號被完全關閉。

由於馬克是Google全傢桶的忠實用戶,Google這一決定的後果相當慘痛:

他不僅失去自己的 Gmail 郵件、通訊錄、日歷,還因為是 Google Fi 虛擬運營商的用戶,連手機號都被一起凍結。

到這裡,噩夢還遠未結束。

Google不僅封他的賬號,還直接把這件事報到專門打擊兒童色情/性虐待內容的監督機構那去,該機構後來又聯系舊金山警察部門。終於在去年年底,舊金山警方從Google公司那裡調取關於馬克的所有資料和記錄,正式對馬克展開調查。

長達一年的時間裡,馬克面臨“戀童癖”的嚴重指控,工作生活都難以開展,甚至幾乎“身敗名裂”……

《紐約時報》描述此事的文章提到,將馬克置於尷尬境地的,正是Google少為人知的兒童性虐待內容打擊系統。

根據美國政府的定義,兒童性虐待內容(Child Sexual Abuse Material,以下簡稱 CSAM),包括照片、視頻等,隻要其中涉及未成年人露骨色情行為的畫面,都屬於此類內容。更具體來說,涉及包括誘騙、勒索、展示/鼓動/宣揚性化 (sexualization) 未成年人、拐賣兒童性質的內容,都屬於Google明令禁止的 CSAM 范疇。


圖片來源:Google

為防止平臺、產品和技術被用於傳播 CSAM,Google投入大量資源,對 CSAM 進行掃描、阻止、移除和舉報——然而這次讓馬克遭殃的並不是Google的掃描技術,而是Google的人工查驗流程出疏漏。

在各大公司,CSAM 檢索和事後舉報的流程,都包括算法掃描和人工查驗的雙保險制度,Google也不免俗。然而在馬克的遭遇當中,在算法發現照片,並自動觸發系統鎖死馬克的賬戶,並交由人工查驗之後,核查員似乎並沒有考慮當時的場景,沒有發現這張照片是發給醫療專業人士的。

事後,馬克立即進行申訴。然而Google不僅拒絕復核之前做出的決定,甚至都不讓他下載保存自己的數據。被關閉的賬號,數據在兩個月後就被自動刪除,馬克失去過去多年積累的很多重要信息。

事情就這樣拖整整一年,直到去年年底警方正式啟動調查。

在這一年裡,馬克幾近“社死”,很難跟同事和朋友完整、誠實地解釋,自己的電話號碼、郵箱,為什麼突然就憑空消失。

直到今年前不久,當地警方才完成調查並予以結案。

結果毫無意外:馬克無罪。

對於把自己的忠實用戶推進深淵,Google用法律作為擋箭牌的解釋,很合情合理,卻也綿軟無力。一位公司發言人表示,美國的兒童保護相關法律要求像Google這樣的公司必須對發現的 CSAM 事件進行上報。

根據Google的透明度報告,僅在2021年度,公司就屏蔽近120萬個涉及 CSAM 的超鏈接,向美國相關監督機構“全國失蹤與受虐兒童服務中心” (NCMEC) 提交87萬份報告,涉及約670萬條內容,關閉約27萬個賬號。

遺憾的是,馬克不幸成為27萬分之一。

身處這27萬人中間,就像那些進監獄卻高喊著無辜的人一樣,那種有冤情說不出,說出也不被人相信的滋味,簡直無法想象。

/ 好心辦壞事 /

在介紹打擊 CSAM 工作的官方頁面上,Google宣稱,公司組建並訓練專門的隊伍,使用最尖端的技術來識別 CSAM。

目前在美國大公司的范圍裡,檢索 CSAM 有兩種技術途徑:哈希值匹配,和計算機視覺識別。

哈希值匹配比較簡單,就是調取市面上第三方機構維護的數據庫裡的條目,和自己平臺上的圖片進行哈希值匹配,從而檢測已知的 CSAM 相關內容。這方面早年Google曾經用過微軟的 PhotoDNA。這項技術已經存在10年多的時間,不止Google,包括 Meta、Reddit、Twitter 等公司,以及 CSAM 領域的權威公共監督機構 NCMEC,都在使用它。


圖片來源:微軟

以及,Google系的 YouTube 也在使用自研的 CSAI Match 技術來,實現流媒體視頻的哈希匹配。

當然,每天都有新的違法圖片和視頻誕生,所以除哈希匹配之外,Google還自研並部署基於計算機視覺技術的機器學習分類器,從而檢索“未曾見過”的相關內容。

Google將這一技術整合到 Content Safety API 當中,也開放給第三方使用。目前,包括 Meta、Reddit、Adobe、雅虎等公司,也是Google自研 CSAM 檢索技術的用戶和合作夥伴。


圖片來源:Google

至於本次案件,Google似乎是從馬克的 Google Photos 檢索到相關內容。

Google Photos 是Google推出的照片備份和雲端相冊服務,在自有品牌以及其它一些主流 Android 手機廠商的機型上都有預裝。值得註意的是,用戶在 Google Photos 裡登錄Google賬號後,應用會提示建議用戶打開自動上傳備份——馬克可能就是在這裡吃虧。

如果打開自動上傳功能,除在某些第三方應用(比如 Twitter、Instagram) 下載的照片之外,包括相機照片集,以及手機上生成的其它照片,都會被 Google Photos 會自動上傳到雲端。

而根據官方網站和公司發言人透露的情況,Google不止明令限制用戶通過 Google Photos 上傳和傳播相關內容,它的 CSAM 打擊系統,也會對 Google Photos 裡的照片進行掃描和匹配。

問題在於,根據Google發言人的表述,CSAM 打擊系統的對象僅限於用戶“主動行為” (affirmative action) 上傳的圖片。

從務實的角度來看,馬克開啟 Google Photos 自動上傳,結果因為急著給娃看病,拍這張照片,自動上傳,忘刪,回頭被Google找上麻煩——這樣也要算作主動行為,未免有點牽強。


圖片來源:《紐約時報》

掃描 CSAM,能夠保護兒童安全,有效地打擊戀童癖和各種變態,聽上去怎麼都是一件好事對不對?

然而實際上,近年來美國大型互聯網和科技公司在做這件事的時候各種問題故障和醜聞不斷——結果就是,算法自動化打擊 CSAM 這件事,在技術道德和隱私權方面已經引發巨大爭議。

如果把Google這次烏龍事件形容為“人禍”的話,那麼去年同一時間蘋果出的事故,可以稱得上“天災”。

去年8月初,蘋果突然宣佈,將要在 iOS 平臺上推出一個專門掃描 CSAM 的客戶端側工具。


圖片來源:蘋果公司

蘋果突出的關鍵詞在“端側”上:和Google一直以來掃描雲端服務器存儲的用戶內容的做法不同,蘋果表示隻會在用戶設備上做這件事,系統會下載 NCMEC 的數據庫,然後完全在本地進行哈希值匹配。

然而,蘋果所謂的“端側”、“註重隱私”等,隻是表面說辭。有專傢發現,實際上用戶發送到 iCloud 保存的照片也會成為檢測對象。還有研究者發現蘋果所采用的匹配算法 NeuralHash 存在設計理念缺陷。而且這一技術根本不是即將推出,而是好久以前就偷偷植入到公開版 iOS 裡,蘋果還專門混淆 API 命名,以便“隱姓埋名”。

結果,蘋果宣佈這件事之後沒出一個月,就有人對 NeuralHash 算法實現哈希碰撞和“原像攻擊”。

簡單來說,哈希碰撞就是找到兩張哈希值相同的隨機照片;而原像攻擊,則是“刻意生成的碰撞”,也即先給定一張照片,然後生成另一張和其哈希值相同,但內容不同的照片。

甚至,有人直接在廣受歡迎的 ImageNet 標註圖像數據庫裡,都能夠找到幾對天然的 NeuralHash “雙胞胎”(兩張不同的原視圖片,哈希值相同)……

這些攻擊測試的結果,從原理和邏輯上直接推翻蘋果的 CSAM 檢索技術,使其一文不值。


圖片來源:Cory Cornelius

早期測試的結果顯示,NeuralHash 的哈希碰撞發生率和蘋果宣稱的誤報率水平差不多,屬於可以接受的范圍。然而考慮到蘋果在全球擁有超過15億設備用戶,基數過於巨大,一旦 NeuralHash 出現誤報,甚至哈希碰撞導致的事故,都會波及大量用戶。

總的來看,目前Google、蘋果這兩大移動平臺級超大型公司,在掃描和打擊兒童色情這件事上,都確實努力做一些事情,也值得鼓勵。

然而這件事的另一面,卻令人大為遺憾:

因為一張隨手拍出的照片,工作和生活陷入僵局,甚至險些身敗名裂,這恐怕是馬克,以及不少和他經歷相似的人,所完全沒有預料到的。

這也是整件事的尷尬之處:在過界的科技平臺和糟糕的算法面前,好心真的可能會辦壞事。


相關推薦

2024-08-23

近日,一位父親的無私奉獻和深沉父愛感動無數人。他的女兒不幸患上肝硬化,面對女兒的生命危機,這位父親毫不猶豫地選擇割肝救女。為確保手術的成功,他在半年內暴瘦30斤,以確保自己的身體狀況能夠適應手術需求。這

2022-12-14

事件中被謀殺的學者的兒子在肯尼亞高等法院對Facebook母公司Meta提起訴訟,指控這傢社交媒體巨頭在整個東部和南部非洲助長暴力和仇恨。阿佈拉罕-梅阿雷格-阿瑪爾在訴訟中稱,他的父親梅阿雷格-阿瑪爾-阿佈拉罕是一名提格

2023-11-10

山東青島的一名 10 歲男孩因在試卷上畫豎中指手勢,再加上平時對他人豎中指,被發現後遭到父親的嚴厲教育,罰站近 1 小時。父親靳先生表示,孩子最後在哭泣中認錯,他認為這種教育方式是有效的,相信孩子以後再也不敢

2024-08-06

在巴黎奧運會萬眾期待的水球賽場上,一場旨在展現力量與技巧完美結合的競技盛宴,卻因一場突如其來的小插曲而蒙上一層爭議的色彩。比賽正酣,雙方隊員在碧波蕩漾的泳池中奮力拼搏,每一次觸球都伴隨著激烈的身體碰撞

2022-08-24

性的影響。一位父親的情況就是如此,他的Google賬戶在該公司錯誤地將他剛學會走路的兒子的腹股溝的醫療圖像標記為兒童色情後仍被關閉。根據《紐約時報》的報道,這位名叫Mark的父親在去年2月跟醫生進行視頻預約之前在一

2024-04-05

公真人(全名牧真人)是一位有點特別的小男孩,他經歷戰爭,母親也因此喪身火海。後來父親和繼母夏子阿姨組成新傢庭,但他始終難以融入,於是在一隻蒼鷺的引導下,進入一座神秘的廢棄塔樓尋找親生母親。後來夏子消失

2024-01-28

快科技1月28日消息,近日,貴州銅仁,一位父親用鐵鍬給兒子新車硬核除雪的視頻引發網友圍觀。視頻中,父親用鐵楸輕輕刮掉汽車上厚厚的積雪,雖然過程小心翼翼,鐵楸還是刮到一些車漆。兒子表示,自己第二天看監控才發

2022-08-18

這項技術的正是Marina的兒子Stephen Smith,洛杉磯人工智能公司StoryFile的聯合創始人兼首席執行官。Marina傳奇的一生和開放的葬禮問答Marina的一生可以說是十分輝煌。1978年,Marina在諾丁漢郡購買一個廢棄的農場,她和丈夫最初將這

2023-07-03

近日,廣東廣州一名環衛工人的兒子高考考687分,目前已經選擇上海交通大學。這位環衛父親接受采訪稱,清華大學、浙江大學、復旦大學、中科大(中國科學技術大學)都曾來打電話詢問。這位父親還表示:就算貸款、賣房也

2024-05-14

在江蘇連雲港,一位名叫李瀟的 05 後少年用他的堅持和努力書寫一個不平凡的故事。出生於 2005 年的他,在經歷中考的挫折後,選擇遊戲代練作為自己的職業道路。李瀟在電子競技領域展現出驚人的天賦,他的決定也得到父親

2023-10-17

10月17日消息,據媒體報道,青島一位00後女孩今年23歲,已經兼職做16次伴娘。能摟席又能有點小收入,主打一個開心。在社交平臺上,像這樣的兼職或職業伴娘並不鮮見。她們就是專為新人結婚時服務的新生職業人群。以伴娘

2023-12-02

當地時間周五上午,美國眾議院就驅逐紐約州眾議員喬治·桑托斯一事舉行一場載入史冊的投票。根據發稿前的最終結果,總共有311名眾議員投贊成票,達到驅逐議員所需的三分之二門檻,另外有114人反對和2人投“中立”票,兩

2024-03-13

3月11日,一位大叔從南寧出發,踏上前往北京的火車之旅。在這漫長的一天裡,大叔僅僅依靠一根蘿卜充饑,這一幕被鄰座的小夥看在眼裡,心中不禁湧起一股同情之情。小夥默默觀察著大叔,發現他雖然疲憊卻堅持著,心中五

2023-03-05

3月4日消息,話題女兒牽著父親的手上領獎臺”上熱搜榜,事情發生在雲南昭通,不少網友為這一幕動容。據解,事情發生在昭通市大關縣大關復興中學,該校組織2023屆高考百日誓師大會暨傢長會。會議的第四部分內容為頒獎典