Z Facebooku a Googlu jsem si stáhl všechna data, co o mně mají. Překvapení se nekonalo

Od skandálu s firmou Cambridge Analytica, která měla zneužívat osobní údaje desítek milionů uživatelů Facebooku v politických kampaních, se do pozornosti opět dostala otázka, co všechno vlastně internetoví giganti o svých uživatelích vědí. Rozhodl jsem se to zjistit také. To, co o mě věděl Facebook a Google, mě však vůbec nepřekvapilo. Problémem je spíše potřeba větší transparentnosti.

Překvapený jsem možná nebyl proto, že se o tyto otázky dlouhodobě zajímám. Přemýšlím, co na sociální sítě nahrávám, nepovoluji jim přístup do jakýchkoliv aplikací (v případě třetích stran si raději vytvářím samostatný účet, než bych ho měl spárovat s Facebookem).

Případ Googlu je jiný – bez něj v podstatě nemůžu existovat. Kromě vyhledávání a používání jejich map, kalendáře a Chromu jsem uživatelem Gmailu, a to v několika aktivních mailových schránkách. Doplním, že nejsem a nikdy jsem nebyl majitelem telefonu s Androidem, což dokáže ovlivnit zejména lokalizační data o mém pohybu.

Jen pro správnost rovnou přiznám, že jsem se ve své snaze nechal inspirovat Dylanem Curranem, který udělal to samé a své zjištění zveřejnil na Twitteru.

Facebook téměř nepřekvapil…

Největší sociální síť světa nabízí možnost stáhnout si všechny informace každému uživateli. Proces je to jednoduchý. V nastavení v sekci Obecné stačí kliknout na Stáhněte si soubor se svými daty. Asi po hodině mi přišel e-mail s tím, že data jsou připravena ke stažení. Protože celá složka měla něco málo přes pět gigabajtů, samotné stahování a následné rozbalování ze zipu trvalo několik desítek minut.

Shrnutí dat mě ale nepřekvapilo, až na jednu výjimku. Tou byl seznam lidí a k nim přirazených telefonních čísel. Facebooku jsem přitom v telefonu explicitně zakazoval přístup do mého adresáře. Vzhledem k tomu, že byl seznam jmen relativně zastaralý seznam, je ale možné, že před několika lety na jiném telefonu jsem mu tento přístup povolil. Nebo to některé zařízení udělalo automaticky s možností opt-out, kterou jsem tehdy ale neřešil.

Jinak jsou data dostupná ve formátu .htm a .html a připravena relativně přehledně, což ocení i méně technicky zdatní uživatele. K dispozici je třeba seznam všech přátel s datem vzniku přátelství, ale také seznam bývalých přátel s datem, kdy jsme se na Facebooku rozloučili.

Facebook má k dispozici všechny zprávy (včetně fotek, videí apod.), které jsem si s kýmkoliv ve své historii poslal. Což nemůže být překvapením, protože je mám stejně dostupné také při používání Messengeru.

V případě fotek nebo videí mi Facebook ukázal všechny, které jsem na sociální síť nahrál. Pozitivním překvapením bylo, že záznamy neobsahovaly fotografie nebo obrázky, které jsem odsud během několika posledních let vymazal.

Co vás může překvapit

Pro většinu uživatelů Facebooku může být velmi překvapivá informace o tom, které aplikace nebo třetí strany mají k jejich datům přístup. V mém případě to jsou čtyři (Uber nebo Airbnb). Při rozhovorech s kamarády se ale ukázalo, že jich tam běžně mají několik stovek, a často vůbec netuší, co jsou zač. Tyhle informace je možné zjistit i bez stahování celého archivu. Stačí kliknout sem.

Podobně překvapivé mohou být data související s reklamami. Viděl jsem seznam, na které jsem za posledních několik měsíců klikl, společně se seznamem potenciálních pro mne zajímavých témat. Mnoho lidí bude pravděpodobně překvapeno i ze seznamu všech lajknutých stránek a skupin, ve kterých se nacházejí a podobně.

Druhým možným vysvětlením, proč z Facebooku překvapen nejsem, však ale může být, že opravdu jde jen o data, které jsem mu sám dobrovolně poskytl. Nadstavba, kterou nad nimi samotná sociální síť a její algoritmy dělají, mi zůstala skryta. Je přitom nepochybné, že si společnost staví celý můj osobnostní a psychologický profil. To už ale tak jednoduše nepřizná.

Jsem si jist, že sociální síť sleduje kromě toho, na co vše jsem tam klikl (což v seznamu dat nebylo), také to, jak dlouho na jednotlivé posty koukám, jak dlouho setrvávám na stránkách třetích stran, když na ně kliknu a podobně.

V tomto ohledu může být zajímavý program Data Selfie, který na základě využití umělé inteligence Watson od IBM dělá základní psychologický profil uživatele. Ve svých základech se pravděpodobně podobá tomu, co o nás ví Facebook. Analýzu jsem týden testoval i já sám, výsledky jsou shrnuté tady.

Google nepřekvapil už vůbec

Podobně jako v případě Facebooku mě osobně nepřekvapila ani data, která mi poskytl Google. Respektive která o mě ví. I ty si můžete sami stáhnout na této adrese. Na rozdíl od Facebooku trvala příprava dat několik hodin, poté jsem taktéž dostal e-mail s odkazem na stáhnutí. Celý soubor měl něco kolem tří gigabajtů.

Informace se týkají celkově 29 služeb, které Google poskytuje. O některých z nich jsem nikdy neslyšel, ale to nebyl žádný problém, protože v rámci nich ani žádná data nebyla nalezena. Jinak je to strohý přehled třeba souborů na Disku, data z kalendáře, několik málo údajů z Chromu (jako moje uložené záložky), historie konverzací na platformě Hangout, jedna uložená adresa v Google Maps a také celá historie videí, které jsem kdy viděl na YouTube.

Jako v případě Facebooku jde opět v podstatě o všechna data, která jsem Googlu dobrovolně poskytl, a nečekalo mě nic překvapivého. Spíš jsem zklamán z toho, že jejich součástí nebyl žádný seznam mých vyhledávání (které, pochopitelně, využívám hodně) a třeba seznam všech linků, na které jsem klikl. Podobně chyběly také data o tom, co si o mě Google myslí, že jsem za člověka.

Pomohla by větší transparentnost

A to se právě ukazuje jako problém, zdaleka nejen Googlu. Na základě vyžádání firmy poskytují data, která jim uživatelé poskytují, neukazují však nic navíc. To jsou pochopitelně informace vyšší úrovně, zahrnující probíhající analýzy dat a jejich výsledky o tom, jak nás tyto společnosti profilují a na základě čeho nám pak třeba ukazují reklamy.

I vzhledem k obvinění Facebooku související s firmou Cambridge Analytica je přitom právě tato část dat ta nejpodstatnější. Internetoví giganti převzali rétoriku neziskového sektoru s tím, že pomáhají budovat komunity nebo zlepšovat informovanost. Pořád ale jde o firmy podnikající za účelem zisku. Shromažďují obrovské množství dat, o čemž běžní uživatelé pravděpodobně často vůbec netuší, a pak s nimi dál pracují způsobem, který běžně zůstává zatajen i jejich samotným zaměstnancům.

Zákonodárci se s tím alespoň v Evropě snaží něco dělat – patrně i proto vznikla legislativa GDPR, obecné nařízení o ochraně osobních údajů. Ve světovém měřítku jde o jednu z nejpřísnějších ochran s cílem vrátit moc nad svými údaji zpět do rukou lidí. Jestli je tohle ten správný způsob a jestli bude vůbec fungovat, se uvidí až v praxi, pravděpodobně za několik let.

To však vůbec nemusí stačit. Potřebné je vyvíjet (nejenom) na technologické giganty tlak, hlavně ze strany nás uživatelů, aby opravdu pečlivě a upřímně vysvětlovali, jak vlastně pracují, za jakým účelem a jak konkrétně s našimi daty nakládají. Dopady jejich rozhodnutí a fungování tajemných algoritmů ovlivňují doslova miliardy životů, a proto je v zájmu nás všech, aby tyto firmy fungovaly transparentně.

Diskuze k článku