如果說(shuō)近年來(lái)眾多的科技丑聞教會(huì)了我們什么的話,那就是科技公司掌握了我們所有人的海量數(shù)據(jù)。這不僅讓我們感覺受到了侵犯,而且一旦這些數(shù)據(jù)落入壞人之手,這可能是相當(dāng)危險(xiǎn)的。
作為對(duì)此風(fēng)險(xiǎn)的回應(yīng),歐洲將“訪問權(quán)”作為“通用數(shù)據(jù)保護(hù)條例”(GDPR)的一部分。該權(quán)利規(guī)定,任何公司在接到請(qǐng)求時(shí),都應(yīng)向用戶提供與其公司相關(guān)的個(gè)人數(shù)據(jù)。他們應(yīng)該提供一種便于閱讀的方式,并且及時(shí)提供足夠的背景信息,讓用戶了解他們是如何獲得和使用這些數(shù)據(jù)的。人們通常認(rèn)為,只要你知道了一家公司掌握的你的數(shù)據(jù)是什么,你就可以做出是否要提供這些數(shù)據(jù)的明智決策,并在他們未經(jīng)你的同意收集數(shù)據(jù)時(shí),讓他們承擔(dān)責(zé)任。
可問題是,公司通常不怎么愿意提供這些數(shù)據(jù)。畢竟,對(duì)于公司來(lái)說(shuō),如果它的服務(wù)本質(zhì)上是“強(qiáng)制同意的”(最近谷歌就因此被罰款5000萬(wàn)歐元),那么它可能并不希望用戶能夠輕易知道它究竟收集了多少個(gè)人資料。
于是,我決定測(cè)試一下歐盟四大科技公司提供的“訪問權(quán)”,分別為:蘋果、亞馬遜、Facebook和谷歌。我發(fā)現(xiàn),盡管你可以獲得原始數(shù)據(jù),但實(shí)際上能否理解它又是另一回事了,這讓針對(duì)數(shù)據(jù)做出明智的決策變得更加困難。
根據(jù)英國(guó)數(shù)據(jù)保護(hù)監(jiān)管機(jī)構(gòu)(ICO)的規(guī)定,公司必須按要求提供所有個(gè)人數(shù)據(jù)。這些信息必須以“簡(jiǎn)明、透明、易懂和易于獲取的形式,使用清晰和簡(jiǎn)單的語(yǔ)言”,并通過“常用的電子聯(lián)系方式”提供給個(gè)人。這聽起來(lái)很簡(jiǎn)單,但這四大科技巨頭的表現(xiàn)如何呢?
首先,下載個(gè)人數(shù)據(jù)很容易。谷歌和蘋果都有數(shù)據(jù)下載服務(wù)可以讓我選擇我想下載的數(shù)據(jù)。Facebook雖然沒有這項(xiàng)服務(wù),但是在這三家公司各自的網(wǎng)站上都很容易并且很快就能找到這些數(shù)據(jù)。然而,你要是想獲得你的亞馬遜數(shù)據(jù),你需要點(diǎn)擊該網(wǎng)站的“聯(lián)系我們”頁(yè)面中隱藏在列表末尾的單一鏈接選項(xiàng),網(wǎng)站上沒有設(shè)置簡(jiǎn)單的選項(xiàng)以供查找。而當(dāng)你提出要求后,需要整整30天的時(shí)間才能收到一個(gè)鏈接來(lái)下載數(shù)據(jù),這也是規(guī)定限制的最長(zhǎng)時(shí)間。
然而,當(dāng)我真正開始查看我收到的數(shù)據(jù)時(shí),事情變得更加糟糕。一些文件的標(biāo)簽?zāi):磺澹硪恍┪募t存儲(chǔ)為一些限制的格式。實(shí)際上,理解這些我看到的數(shù)據(jù)遠(yuǎn)沒有想象中那么簡(jiǎn)單。
谷歌的位置跟蹤數(shù)據(jù)尤其令人費(fèi)解。該公司曾多次因跟蹤安卓用戶的位置而受到批評(píng),即使他們已經(jīng)關(guān)閉了操作系統(tǒng)中主要的位置跟蹤選項(xiàng)。七個(gè)歐洲國(guó)家的消費(fèi)者團(tuán)體已經(jīng)向他們的數(shù)據(jù)安全監(jiān)管機(jī)構(gòu)提出投訴,使用GDPR下載數(shù)據(jù)應(yīng)該是一種檢查服務(wù),是一種不通過?;ㄕ衼?lái)讓公司獲取更多數(shù)據(jù)的服務(wù)。它應(yīng)該像谷歌這樣的控股公司記賬那樣嚴(yán)謹(jǐn)。
但是當(dāng)你真正看數(shù)據(jù)的時(shí)候,這些東西是很難理解的。我從谷歌獲得的所有位置數(shù)據(jù)都包含在一個(gè)61MB的JSON文件夾中,在我使用Chrome打開它時(shí),出現(xiàn)了一連串令人眼花繚亂的字符,這些字段分別是“timestampMs”、“latitudeE7”、“logitudeE7”,以及關(guān)于我是原地不動(dòng)還是在移動(dòng)中的估計(jì)。
我并不懷疑谷歌與我的帳戶關(guān)聯(lián)的所有位置歷史信息都在這里,但是如果沒有背景信息,這些數(shù)據(jù)是沒有意義的。這只是一串?dāng)?shù)字,我必須付出很大的努力才能稍微理解,并將它們導(dǎo)入另一個(gè)軟件中進(jìn)行釋義。如果GDPR的目的是讓人們能夠更好地控制和理解從公司那里收集到的數(shù)據(jù),那么谷歌的這部分下載數(shù)據(jù)幾乎沒有什么價(jià)值。如果你想將數(shù)據(jù)導(dǎo)入另一個(gè)系統(tǒng),JSON非常好,但是如果你想知道谷歌有多少你的數(shù)據(jù),并做出保護(hù)數(shù)據(jù)隱私的明智決策,那么JSON就幫不上什么忙。
當(dāng)我打開其他文件時(shí),我甚至不清楚我首先要看什么數(shù)據(jù)。在“Ads”文件夾中有一個(gè)名為“My Activity”的4GB HTML文件,里面顯示了一些谷歌收集到的廣告跟蹤數(shù)據(jù),但是卻沒有注釋或元數(shù)據(jù)來(lái)解釋這些廣告跟蹤數(shù)據(jù)到底是什么。
到目前為止,這些是所有下載的數(shù)據(jù)中最令人困惑的文件,但也是最重要的文件。它們包含了潛在廣告商非常熱衷的個(gè)人信息,因此谷歌應(yīng)該更努力去解釋這些數(shù)據(jù)是什么。它已經(jīng)提供了一個(gè)HTML的索引文件來(lái)提供數(shù)據(jù)概覽,那為什么不在概覽中包含關(guān)于每個(gè)文件內(nèi)容的信息呢?
盡管仍然存在一些問題,蘋果在展示數(shù)據(jù)方面的表現(xiàn)就比谷歌要好。蘋果給人的第一印象非常好。蘋果提供的大部分?jǐn)?shù)據(jù)都是易于閱讀和理解的文件類型,比如CSV、TXT和JPG,只有幾個(gè)JSON文件會(huì)讓人混淆。
但當(dāng)你打開這些文件時(shí),就會(huì)發(fā)現(xiàn),仍然有很多信息難以理解。一個(gè)名為“Apple ID 賬戶信息”的文件似乎包含了11條幾乎完全相同關(guān)于我的Apple賬戶的記錄,所有這些記錄都是在2014年的同一天創(chuàng)建的,然而卻沒有解釋它們是什么。另一個(gè)CSV文件的標(biāo)題也含糊不清,叫“應(yīng)用程序和服務(wù)分析”,它里面似乎包含了我在應(yīng)用程序商店搜索的整個(gè)列表,但它有太多的空單元格,要不是看到了文件有6.7MB大,我都沒注意到其中有數(shù)據(jù)。
雖然能夠聽懂我所有的Alexa請(qǐng)求令人毛骨悚然,但亞馬遜在展示數(shù)據(jù)方面要做得好得多,盡管這可能只是因?yàn)樗鼘?duì)我的了解相對(duì)較少。在大多數(shù)情況下,文件和文件夾都有明確的標(biāo)簽,但是亞馬遜還需要更努力,從而更好地標(biāo)明電子表格的內(nèi)容。
具有諷刺意味的是,F(xiàn)acebook實(shí)際上擁有這四種服務(wù)中最容易理解的數(shù)據(jù)。首先,F(xiàn)acebook提供的每個(gè)文件都是一個(gè)HTML文件。每個(gè)文檔都被分門別類到標(biāo)簽清晰的文件夾中,并且有一個(gè)索引文件提供了每個(gè)文檔所包含內(nèi)容的概覽。這些文件的布局和格式都很清晰,盡管儲(chǔ)存在本地計(jì)算機(jī)上,但瀏覽它們就像在Facebook上瀏覽頁(yè)面一樣。
不過,看到Facebook儲(chǔ)存了那么多你的個(gè)人數(shù)據(jù)仍然是非??膳碌模辽倌阒肋@些信息是什么,而不是根據(jù)每個(gè)文件的內(nèi)容去猜測(cè)。
在我的實(shí)驗(yàn)快結(jié)束時(shí),我在我接觸的這四項(xiàng)服務(wù)中只留下了近138GB的數(shù)據(jù)。其中有1.1GB來(lái)自Facebook, 392MB來(lái)自亞馬遜, 254MB來(lái)自蘋果。雖然谷歌有72.5GB的數(shù)據(jù)可供我下載,但其中絕大多數(shù)是我的谷歌驅(qū)動(dòng)器和照片備份,分別為44.3 GB和25.7GB。剩下的谷歌數(shù)據(jù)只有2.5GB。
在嘗試篩選和理解所有的這些數(shù)據(jù)之后,很明顯,如果想要用戶能夠真正掌控我們的數(shù)據(jù),這些公司,以及規(guī)范這些公司的GDPR法規(guī),還有很長(zhǎng)的路要走。能夠下載是一回事,但是讓這些下載下來(lái)的數(shù)據(jù)變得有用則意味著要更努力來(lái)確保這些下載的數(shù)據(jù)對(duì)于普通人來(lái)說(shuō)更容易理解。
至少,這意味著需要提供一個(gè)更好的索引來(lái)告訴你哪些數(shù)據(jù)包含在哪些文件中,但這也意味著要以一種更有意義的方式來(lái)組織這些文件的內(nèi)容。
分享到微信 ×
打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁(yè)分享至朋友圈。