-
云球白?。捍髷祿r代,廣告和隱私的運轉
關鍵字: 大數據隱私保護隱私泄露廣告三、行業鐵律:數據脫敏
這里有一個重要概念,叫做“數據脫敏”,在百度百科上,對數據脫敏的解釋是:數據脫敏是指對某些敏感信息通過脫敏規則進行數據的變形,實現敏感隱私數據的可靠保護。大概意思就是,數據庫中某個條目被貼了很多標簽,但要避免對應到某個實體的人??梢赃@么理解,一個內部ID為0000001234的條目被貼上了“肉夾饃”的標簽,但不知道這個人是誰。即使原本知道,也要把敏感數據拋棄,變成不知道。正規的大數據公司一定會這么做。
這個數據處理過程很復雜,涉及更多的第三方,比如有提供大數據技術平臺的公司,有專門提供數據導入技術的公司,有專門剔除無效數據的數據清理公司,有專門貼標簽的公司,等等,這是一個很大的產業。舉個例子,大家去搜索一下“大數據平臺”(這是所有一切的技術基礎),就會意識到,大數據是全世界經濟生態,特別是互聯網生態的重要組成部分。
四、豐富的數據來源
有一些初創大數據公司,他們的用戶規模不大,數據也不多,無法變現,怎么辦呢?除了努力做大以外,他們可以把自己不多的數據賣給頂部公司,只要數據有特點,頂部公司是愿意買的,作為自己數據的補充。
數據就這么多了嗎?不,這只是一個基礎,數據來源還有很多。從APP角度看,還有很多類似數據分析的通用功能需要第三方插件提供服務,比如地圖定位、消息推送、語音識別、圖像識別、APP防病毒加固、二維碼識別、第三方登錄、第三方支付等等,道理都是一樣的:節省APP開發工作量,同時第三方的標準插件功能更加強大和穩定。但是,所有插件都會獲得某些數據。
獲得數據并不是這些插件的核心目標,但擁有了某些數據后,不進行變現在商業上是不合理的。不過,變現并不容易,因為這些數據過于片面和零散。所以有一種可能,如果公司亟需變現,可以把這些數據賣給已經擁有大量數據的大數據公司,大數據公司可能恰恰需要這些片面而零散的數據,使自己的數據更加完整。
數據來源不僅僅限于APP,PC端不用說了,當然也會貢獻很多數據,但還有很多線下的數據。比如有一種東西,叫做數據探針,有很多種類,WIFI探針、藍牙探針、4G探針等等。這些探針通常被布置在公共場所,當用戶走過,探針會探測到。待了多久、重復了多少次,都是有價值的數據。大家在很多公共場所會使用免費WIFI,這種免費WIFI就起到了探針的作用。用戶獲得了免費上網的便利,也貢獻了到此一游的數據。
WIFI芯片、藍牙芯片、4G芯片都有全球唯一的ID,能夠標識這個芯片,但同樣不會對應到一個真正的人身上。換句話說,這也都是脫敏數據。這些來源有各種用處,比如為線下商家提供信息,這是不是老客戶,但同時也存在匯入頂部大數據公司的可能,使大數據公司的數據更加完善。
下一個數據來源是APP公司的服務器所存放的地方。除非很大的公司,否則服務器通常不會放在自己公司里,這個運維要求很高,自己來搞風險很大,所以會采用服務器托管,放在專門的機房里,甚至大的APP還需要分布式的服務器來提高用戶訪問速度,提供這種服務的供應商叫CDN(內容分發網絡)。不過,現在的趨勢是直接使用第三方云服務,不買服務器了。
托管機房、CDN和云服務都有一定風險,取決于管理水平。他們本身通常是很負責任的,但是面臨黑客攻擊的問題。大多數黑客有商業目的,有可能在路由器或者交換機上植入病毒,通常會干三件事:攻擊特定目標、植入廣告和盜取數據。和前面的數據來源不同,這是明確的違法行為,需要非常嚴厲的打擊。
然后就是數據通道,也就是電信運營商。手機和PC上網都離不開電信運營商,電信運營商的數據很多,但通常對數據的使用極其謹慎,也基本不和第三方合作。理論上,運營商的交換機也可能被黑客攻擊而泄露數據,但這種可能性很小。
還有一些原本的數據擁有方,比如政府機構、銀行、醫療機構和線下商業機構,但目前來看,政府機構、銀行和醫療機構的數據被整合的可能性很小,商業機構的數據整合理論上可行,但在實施層面非常困難。而所有數據的整合都有一條行業鐵律:脫敏。
另外,無論哪個環節或哪一個機構,都不能排除一個特例:私人行為倒賣數據。這也是明確的違法行為,就像快遞員泄露地址一樣,和大數據產業或者互聯網廣告產業本身應該做出區隔。
總之,數據來源很多,整合這些數據并使其具有商業價值并不容易。舉個例子,PC數據和手機數據來自兩個設備,如何進行整合?最簡單的方法當然是通過登錄的用戶名來判斷,但這不是正當做法,違反脫敏原則。多數情況下,需要其他手段進行對應,比如總在一個WIFI局域網中上網就是一個依據,特別是在家中,只有這兩個設備的時候。
說到這里,大家會發現一個基本問題,大數據公司匯集了各種來源的數據,為什么要進行這種匯集?各種數據本身不能自行變現嗎?實際上,這是大數據的一個特點:在一個足夠大的規模上,這些數據是有價值的,而數據規模不足,很可能完全不靠譜。如果有一千萬人被貼上了“肉夾饃”的標簽,那么你向這一千萬人投放“肉夾饃”廣告是一個靠譜的事,但如果某一個人被貼上了“肉夾饃”的標簽,被貼錯的可能性是很高的。微信剛剛推出朋友圈廣告的時候,很多人覺得推給自己的廣告莫名其妙,就是這個原因。
筆者的兒子是個高中男生,但他認為自己被貼上了“家庭主婦”的標簽,最近總被推送吸塵器、拖把、掃帚的廣告,他分析原因,很可能因為自己總是點外賣和購買各種食品。
不少人提到手機麥克風偷聽的問題,這不能說完全沒有可能,但如果是這樣,實施者確實做了一個很奇怪的商業決策。語音識別并不是一個門檻很低的技術,即使擁有這門技術,這件事情對手機或者服務器資源消耗也比較大,在大量語音識別中得到有意義數據的命中率恐怕很低,即使得到數據,準確性也不見得有多高,想想蘋果Siri的準確率就知道了。即使完全不考慮法律和倫理風險,純從商業角度看,這么做似乎也是很不合算的。
有些情況下,隱私泄露的概念有一些混淆。比如新聞中報道的拖庫事件,是指某個網站或者APP的數據庫泄露,這種數據通常是業務數據,而業務數據是未經脫敏的,可能包含很多敏感的隱私數據,例如用戶名和密碼,這種情況是很嚴重的問題。但就互聯網廣告而言,所使用的數據通常是用戶行為數據,是經過脫敏的,兩者有很大不同。
五、廣告投放:另一個鏈條
數據有了之后,下一步是廣告匹配投放的問題,這其實又涉及到另一個產業鏈條,而且同樣是很大的產業。原因很簡單:不是每個公司都能把廣告賣出去。廣告界有自己的游戲規則,所以有專門的第三方廣告插件公司,會插入到各種APP中,APP和網站們其實并不知道自己投放了什么廣告,有時自己也很郁悶,為什么我的網站是小清新,卻出現了大叔風格的廣告。
可能很多人已經看出了這里面一個很大的問題:如果有一個APP,自己有大量用戶,自己有大數據分析能力,自己還有廣告售賣能力(可能是賣給自己的網站用戶),那么就形成了一個閉環,不需要第三方的幫助就可以非常良性地運行。而小的APP,離開了眾多第三方的幫助,將完全無法競爭。
事實上,這是歐盟GDPR法案在制訂時最糾結的事情:過于嚴格的數據保護(例如禁止任何形式的數據交易)將很容易導致大公司的壟斷,扼殺中小企業的發展之路。
六、結語
筆者認為,國家應就個人數據進行更完善的立法。在此之前,權威專業機構首先應該對個人數據建立分級體系。
簡單來說,可以定義重隱私和輕隱私之類的概念,重隱私絕不可以進行任何形式的轉移,更加不能交易,而輕隱私可以允許轉移和交易。像用戶名、密碼、身份證號、電話號碼、聊天記錄之類的信息毫無疑問屬于重隱私,而用戶瀏覽行為或者出沒地點之類的信息屬于重隱私還是輕隱私就是需要被討論的話題了。
(作者簡介:從事IT和互聯網行業二十余年,現為科幻作家,2019年1月出版人工智能長篇科幻小說《云球》第一部,首月月銷超過四千冊,微博@云球白丁。)
本文系觀察者網獨家稿件,未經授權,不得轉載。
-
本文僅代表作者個人觀點。
- 請支持獨立網站,轉發請注明本文鏈接:
- 責任編輯:陳軒甫
- 最后更新: 2019-03-24 16:36:14
-
王羲之華佗“真跡”扎堆出現 量子科技鑒定靠譜嗎?
2019-03-24 14:18 科技前沿 -
三大電信運營商5G投入將謹慎務實
2019-03-23 21:05 -
騰訊:因上海運營商光纖大面積故障,多個業務受影響
2019-03-23 17:52 網絡戰線 -
5G應用,聯想楊元慶怎么說
2019-03-23 16:36 科技前沿 -
中國科研人員開發出“蟻群”微型機器人
2019-03-23 15:20 科技前沿 -
庫克:感謝中國打開大門
2019-03-23 10:24 蘋果新“品” -
這個巨環背后,是中國人的原始創新
2019-03-23 10:02 科技前沿 -
湖北發現5億年前“寒武紀化石寶藏”
2019-03-22 20:05 -
媒體:全球晶圓廠支出下降 中國IC設備市場獨好
2019-03-22 13:31 -
長江存儲年底量產64層堆棧3D NAND閃存,與國外差距縮小到2年
2019-03-22 13:26 -
小米否認雷軍減持3.78億股:惡意造謠,保留法律追訴權利
2019-03-22 13:22 -
沒有現貨背后,柔宇五行缺“硬”
2019-03-22 10:20 大公司 -
中國移動將新增5萬個5G基站 投資額不明確
2019-03-21 22:57 -
我國預制裝配式電力綜合管廊施工關鍵技術獲新突破
2019-03-21 22:46 -
一加CEO劉作虎點評全程DC調光:這是營銷
2019-03-21 20:26 -
中國首個大型先進商用壓水堆燃料組件研制成功
2019-03-21 19:09 -
三一自主研發無人壓路機 路面施工進入智能時代
2019-03-21 18:30 -
日月光5G毫米波天線封裝,下半年有望先行量產
2019-03-21 17:47 5G -
價格猛!華為P30 Pro四攝參數曝光:40MP索尼IMX650、50倍變焦
2019-03-21 17:06 -
我國攻克碳-14標記關鍵化合物制備與標記技術難關
2019-03-21 15:16 科技前沿
相關推薦 -
被逼急了,格陵蘭島總理:是時候獨立了 評論 71美媒直呼:啥都能威脅國家安全,美國完全走偏了 評論 100司機留信曝光:同胞們醒醒吧,美國快病死了! 評論 263“沒想到拜登竟會如此對待盟友!” 評論 214事關中國FK-3,塞爾維亞:這是一個“里程碑” 評論 169最新聞 Hot
-
被逼急了,格陵蘭島總理:是時候獨立了
-
美媒直呼:啥都能威脅國家安全,美國完全走偏了
-
“到2030年,中國本土數學家將能引領世界”
-
密謀推翻馬爾代夫總統?印度回應
-
域外調查惹惱國際奧委會,“2034鹽湖城冬奧會有點懸”
-
欲爭奪歐洲最大電動車市場,但英國國內阻力不小
-
土耳其喊話歐盟:他不干,我干
-
“沒想到拜登竟會如此對待盟友!”
-
司機留信曝光:同胞們醒醒吧,美國快病死了!
-
特朗普炮轟:英國犯下了大錯!
-
盧卡申科:計劃訪華,事關未來
-
特朗普“封口費”案將于1月10日宣判,“但不會入獄”
-
“美國沒能改變中國”,布林肯一聽急了…
-
事關中國FK-3,塞爾維亞:這是一個“里程碑”
-
“中國真出手怎么辦?企業緊張研判…”
-
以己度人?“中方為了談判籌碼”
-