亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
慕課專欄

目錄

索引目錄

用技術人的眼光看世界 • 程序員技術指北

原價 ¥ 99.00

立即訂閱
04 新西蘭恐襲,瘋狂刪帖的小編,背鍋的算法工程師
更新時間:2020-05-31 22:19:01
天才就是百分之二的靈感,百分之九十八的汗水。——愛迪生

1.

當地時間 3 月15日下午 1 點 40 分左右,新西蘭基督城發生恐怖襲擊。已確認有 50 人遇難,另有 50 人嚴重受傷。遇難者不乏兒童,婦女和老人。

相信這個新聞,大多數人都已經知曉了。在這里再簡述一下大致經過。3 月 15 日下午,新西蘭的兩座著名清真寺,先后遭到槍手襲擊。槍手對手無寸鐵的民眾進行掃射,包括對街道的來往車輛進行掃射。隨后,基督城醫院也發生了槍擊。同時,警察在嫌犯的兩輛汽車上發現了大量汽車炸彈,所幸沒有引爆。奧克蘭火車站和商場附近也發現了疑似爆炸包裹,但沒有相關傷亡報告。至今,警察已經抓捕了 4 名嫌犯。

圖片描述或許是新西蘭這個國家本身離國際政治的漩渦較遠;或許是中國民眾對新西蘭的熟悉程度遠沒有美國強烈。不管怎樣,我發現這個事件在中文媒體上,并沒有引發太大的討論。但是,目測,站在國際歷史的角度,這個事件將產生深遠影響。事件本身已經再次帶動很多國家對“白人優越主義”這一極端思想的討論和控制??忠u后,新西蘭的槍支賣到脫銷,但與此同時,就在當地時間 3 月 21 日,新西蘭政府改寫了法律,實施了“禁槍令”。這些事情不僅對新西蘭產生了巨大影響,更進一步將對世界范圍對槍支控制問題的態度產生影響。另外,由于一名嫌犯已確認是澳洲國籍,這也使得新西蘭和澳洲這兩個看似不太介入國際事務,在一般民眾看來是 super safe 的國家,產生了微妙的變化。

但是,作為一個技術向的專欄,這些政治,經濟,世界格局變化相關的問題,不是我想討論的重點。整個事件有一個更加與眾不同的地方,和技術息息相關,甚至,在我看來,有可能引發技術世界的震蕩。

2.

在這次恐襲事件中,一名嫌犯,頭戴一個配備了 go pro 的頭盔,在 Facebook 上直播了槍擊過程,畫面極其血腥殘酷。待 Facebook 發現事態異常,做出反應,封禁了兇手的賬號,整個視頻已經在網上直播了 17 分鐘。

圖片描述對于整個硅谷,這一切還只是一個開始。

很多同學可能并不了解,即使是 Facebook、Google 這些國外平臺,也是擁有著一個龐大(或者說是相對龐大)的審核隊伍的。這些審核人員,每天處理的,就是對違反平臺規范的內容進行“刪帖”處理。通常,這些規范包括:色情內容;盜版內容;宣傳仇恨或者極端思想的內容;極度反人性的內容,等等等等。

我在這里列舉的這些內容規范,看似很容易。實際上,每一個標準都蘊含著巨大的灰色空間。比如:什么是色情內容?露點就是色情內容?那斷臂的維納斯怎么算?而另一方面,很多不露點的視頻,反而更具色情意味,對青少年擁有更強大的誘惑力和破壞力。這個問題本身就是一個很深刻的問題,甚至可以專門做成學術研究了。但在實踐中,色情和非色情的分界線到底在哪兒?在這些審核人員的主觀判斷中。

其實,在 Google 離開中國之前,由于中國的法律原因,Google 中國就擁有一支龐大的“鑒黃師”團隊。我曾經認識一個同學,本科時期在這個團隊里實習過。嗯,是的,這個團隊不做技術工作,天天觀摩不良信息內容。有興趣的同學,可以在網上搜索“鑒黃師”這個職位,這個職位現在依然存在。甚至,很多這些大企業大平臺的工作人員,了解到了其中巨大的需求,辭職創業,提供這種“審查”服務。畢竟,這種“審查”工作所需要的人員素質,和這些IT巨頭整體需要的人員素質,擁有著巨大的差異。外包,或許是最劃算的。

說回新西蘭恐襲,在兇手在 Facebook 上直播了 17 分鐘之后。這段視頻在互聯網上真真正正地火了。從某一個角度看,這近乎是人類歷史上第一次從兇手的角度進行相對完整的殺人視頻直播。在 Facebook 這一個平臺上,這段視頻的上傳量,在 24 小時內,就達到了 150 萬次。注意,是上傳量,不是播放量!同時,被 Facebook 攔截的這段視頻的上傳數,達 120 萬次。這還僅僅是 Facebook 這一個平臺。

而實際上,這段視頻傳播最廣的平臺,是宇宙第一視頻網站—— Youtube。但是,Youtube 官方至今都拒絕透露,他們究竟刪除了多少相關視頻??梢钥隙ǖ氖牵@段視頻上傳的頻率,是以毫秒為單位計算的。

3.

很多同學一定會想,難道不能使用人工智能技術自動鑒別這段視頻嗎?

事實上,如果大家上傳的視頻都是原始版視頻,使用自動化技術鑒別它是極其容易的,根本不需要動用人工智能。對視頻文件計算一個哈希值,直接匹配就好。但問題的關鍵是,up 主們知道這段原始視頻一定被禁止上傳,所以想出各種各樣的方法“改編”視頻。

這其中的方法包括:或者改變視頻的分辨率;或者對視頻進行剪輯,截取部分內容;或者為視頻添加水印;或者在其中插放其他過場動面或者解說?!叭说馈币恍┑?up 主,會給視頻中的部分內容打上馬賽克 —— 但是,這無法改變這段視頻宣揚暴力的實質,反而為視頻的自動化審查添加了巨大的麻煩。甚至,有的 up 主,動用更加現代化的工具,將視頻中的人物頭像,都修改成了動物頭像。整個視頻看起來就是在打電子游戲。呵呵,是的,我們的人臉識別技術可以輕易做到這一點,但是,鑒別技術卻無法識別,這到底是一段“宣揚暴力的真實殺人直播”,還是一個 16 歲小孩臥室中的電子游戲直播。

圖片描述由于這段視頻上傳量太大,Youtube 團隊還是采取了史無前例的措施。過早的啟動了自動化人工智能工具,來自動識別這段視頻。如果有機器學習背景的同學都明白,使用機器學習解決這個問題,是一個典型的分類任務,更進一步,是一個二分類任務。機器只需要識別每段視頻,是或者不是新西蘭槍擊案直播,就好了。但是,這個識別過程并不容易。一方面,視頻數據本身,相比圖像數據,數據量高出了太多,整體數據處理規模上升了好幾個臺階;另一方面,要想訓練出一個性能優良、識別率高的模型,不是寫一兩行代碼就能搞定的事情,需要算法工程師們夜以繼日地調參和測試。這絕不是一個在 24 小時內可以搞定的任務。但 Youtube 團隊在 24 小時內,決定使用機器接手。

這么短的時間,上線的“智能”,一定有巨大的錯誤率。這個錯誤,或者是漏判,即本來是槍擊視頻,但是機器沒有識別出來;或者是誤判,即本來不是槍擊視頻,機器卻誤以為是槍擊視頻。了解機器學習的同學應該了解,這兩類錯誤是互相牽制,此消彼長的。通過調節參數,減少了一方錯誤,就會增加另一方錯誤。在這個事件中,明智的選擇,顯然是要盡量降低漏判的幾率,所以,得到的結果,就是產生了大量的誤判。在一段時間中,Youtube 很多無辜的 up 主受到了牽連,無法上傳正常的視頻。

4.

這樣的危機,在 Youtube 內部,也不是第一次發生了。近乎就在幾個月前,就有很多家長投訴 Youtube,有 up 主上傳小豬佩奇的動畫片,但看到一半的時候,會突然播放恐怖的,慫恿兒童自殘甚至自殺的片段。這些片段可能只會持續幾秒鐘?,F代的人工智能技術還完全無法檢測到一段正常視頻中間,是否夾雜了這樣的片段。要想識別出含有這種片段的視頻,近乎只能靠舉報,之后刪除??墒牵@樣的事后彌補,傷害顯然已經造成了。更可悲的是,即使我們知道了有這樣的行為,我們依然無法自動化的事前預防。因為這種“極端思想的宣揚”,可以以任何一種畫面形式表達出來。相較而言,大吹大擂的人工智能,真的是人工智障。

要想事前預防,近乎只能進行人工事前審查。但對于 Youtube 這種規模的視頻網站而言,這幾乎是不可能的。2017 年的數據,Youtube 每分鐘就有 400 小時的視頻上傳,這個數據還在逐年,甚至是逐日攀升。

人工智能完全無法應付這項工作,至少現在不能,在短時間內,也很難完成。這是一個明顯的“強人工智能”才能解決的例子。雖然機器只需要回答 yes 或 no,但是為了能夠理想地回答好這個問題,機器需要擁有和人類一樣的經驗力、推導力、主觀判斷力、甚至是直覺。事實上,不要說視頻了,即使是圖片,現在我們還只是在為機器可以更好地識別圖片中到底是什么動物,什么場景而慶祝。但這些任務,幼兒園的小朋友都能分分鐘完勝那些上億美元投資的項目。

在新西蘭槍擊案發生三天之后,新西蘭總理更是直接把矛頭對準了 Facebook,為什么槍手直播了長達 17 分鐘之久之后,Facebook 才做出反應?

圖片描述Facebook 為此已經忙作一團。甚至,已經開始探討是否要停止“直播”業務。畢竟,開展直播這樣一個服務容易。但要能即時,準確地辨別直播內容是否合法,是否在宣揚極端思想,這已經不是技術水平上難了幾個數量級的問題了。而是,人類現代的科技,根本做不到。

5.

讓整件事情朝著更壞的方向發展的,則是所謂的推薦系統。事件發生初始,這段直播視頻只是產生了一定的熱度。畢竟,這是一個國際關注的事件,與此同時,人總會有一定的獵奇心理。但是,推薦系統則直接起到了推波助瀾的作用。

如果你去學習專業的推薦系統知識,你會遭遇大量宛如天書一般的公式。但是,如果用人話把推薦系統的原理說出來,那么非常簡單 —— 別人喜歡的東西,特別是你的朋友,你的親戚,或者和你相似的人喜歡的東西,那么八成也就是你喜歡的東西,推薦系統就推薦給你。在整個事件中,推薦系統收集到了越來越多的人對于這件事情關注的熱度,之后推波助瀾地又將這些視頻推薦給了更多的人。推薦系統忠實地履行著自己的算法。但是,很多人開始指責系統為什么會被設計成推薦這樣的視頻?算法工程師們莫名奇妙地背了一口大鍋。

可是,推薦系統在運行過程中有一個基本假設,就是內容本身,應該是安全的。這就好比在我們討論吃什么的時候,不會思考我們所選擇的食材,可能有一部分有毒一樣。然而,在互聯網的世界中,這個假設其實根本就不成立。之前文章已經分析了,實時準確地辨別視頻內容是否安全,還不是人類在當下這個時代所掌握的科技。

如今,很多媒體在報道新西蘭事件中,需要小心地使用關鍵詞,才能不被推薦系統帶歪,把自己的新聞和有可能再次卷土重來,或者本身就沒處理干凈的槍擊案直播視頻聯系起來。雖然有些夸張,但我已經隱隱看到了人類無法控制機器,畏懼機器,小心翼翼地在機器指定的規則下茍活的影子了。
圖片描述從另外一個角度看,整個社交網絡,突然變得和“核彈”一樣。人類制造了它,卻無法駕馭它??植乐髁x正在以一種新的方式,將社交網絡武器化。這種武器的傷害,直指人類的精神世界。但是,貌似現如今我們還不能控制這種武器帶來的傷害;而關閉所有的社交網絡,顯然也不可行。社交網絡好像另一個“潘多拉的魔盒”,已經被打開了,卻再也關不上。

6.

實際上,在技術的世界中,早就有一派人士,一直在大聲疾呼:很多技術并沒有經過有效的“安全”驗證,就已經被極大規模地運用在了各個領域。誠然,這些技術一定極大地方便了我們的生活,但是這樣的方便背后,究竟犧牲了什么,我們還不知道?;蛘呶覀冎溃珪簳r選擇了無視。

對于很多“傳統”行業,比如實施一個建筑工程,或者設計一款新的車型,或者對一片新的礦區進行勘探,我們所需要付出的事前準備工作和安全驗證工作,都是巨大的,繁瑣的。連帶一系列安全問責機制,已經在事前被建立明確了。相較而言,上馬一個互聯網項目,事前的安全準備工作近乎為 0。我們甚至完全沒有與之匹配的標準、流程、心理準備。與此同時,公認的,大多數已有的互聯網項目中,對安全的控制,都是遠遠不足以承載這個項目本身的重要程度。這是一個很殘酷的事實。

人類發展技術,卻忽視技術本身在人類社會中應用可能產生的安全風險,我將之稱為“技術優越主義”。新西蘭槍擊案的兇手大力鼓吹“白人優越主義”,是在宣揚白色人種族裔優于其他人種;那么我們當今世界很多人所追求的技術發展,如果稍微深思一下,的確是隱含著技術優于人類的思想。

我熱愛技術,并一直關注著技術的發展。但我不希望,技術,在我,和我們的關注下,一步一步變成魔鬼。

}
立即訂閱 ¥ 99.00

你正在閱讀課程試讀內容,訂閱后解鎖課程全部內容

千學不如一看,千看不如一練

手機
閱讀

掃一掃 手機閱讀

用技術人的眼光看世界 • 程序員技術指北
立即訂閱 ¥ 99.00

舉報

0/150
提交
取消