Podnětná kniha o tom, jak analyzovat digitální data
Stephens-Davidowitz, Seth: Všichni lžou (in Respekt)

Podnětná kniha o tom, jak analyzovat digitální data

Kniha zkoumá digitální data a ukazuje, že jejich prostřednictvím se můžeme dozvědět leccos z toho, co o sobě ani my sami nevíme. Radí také, jak s daty coby nebezpečně dvousečnou zbraní náležitě zacházet. Autorovy interpretace jsou někdy příliš přímočaré, ale celkově jde o potřebnou a užitečnou publikaci.

Jak vypadá mapa amerického rasismu? Kolik lidí lituje toho, že má děti? Co je spouštěčem zločinů z nenávisti? Vyhledávají lidé vtipy, aby se rozveselili? Jak vysoký je počet žen, které mají každý měsíc pohlavní styk s plyšovými zvířátky? Od kdy americké ženy touží nikoli po zmenšení, nýbrž po zvětšení svých zadečků? Co o lidské sexualitě vypovídá preference různých typů videí portálu Pornhub? A nakolik rozhoduje o budoucí kariéře člověka konkrétní vysoká škola, již vystuduje?

Novinář a datový analytik Seth Stephens-Davidowitz tvrdí, že na tyto netradiční otázky zná odpovědi. Ve své knize Všichni lžou. Velká data, chytré algoritmy a jak nám internet může říct, kdo opravdu jsme vysvětluje, jak k nim došel: nikoli formou tradičních dotazníků, ale studiem neskutečně olbřímího množství digitálních stop, jež po sobě zanecháváme. Jejich povaha přitom může být značně různorodá: především jde o dotazy, které zadáváme do vyhledávačů, nebo stránky, na něž nejraději klikáme. Formou cenných dat jsou ale pro autora také fotografie nákupních front, kvantita a kvalita nabízených jablek v obchodech či fotografie z vesmíru. Jak sám říká: „Všechno jsou data!“

Permanentní lháři
Podle Stephens-Davidowitze se nám jejich analýzou otevírá nový přístup ke studiu lidského chování a smýšlení, ať už se týká politické preference, nebo sexu. Jde přitom o pohled nepřikrášlený, určovaný nikoli tím, co o sobě tvrdíme a jak chceme být vnímáni, ale jak skutečně jednáme a smýšlíme. Takto máme chápat i titul publikace: lidé lžou stále, v dotaznících, svým přátelům i sami sobě, „aby vypadali líp“.

Na základě těchto hloubkových dat autor například srovnává jednotlivé státy USA a ukazuje, že v mnoha z nich nebyla po zvolení Baracka Obamy hlavou státu nejvyhledávanější kombinace slov „první černošský prezident“, nýbrž „prezident negr“ (nepřekvapivě pak právě v těchto regionech uspěl Donald Trump). Pozoruhodně ale autor sleduje také to, jak nepřátelsky orientovaní voliči reagovali na Obamovy projevy. Když je prezident vyzýval k většímu respektu vůči muslimům, tyto posluchače, neboli právě ty, kterým byla tato slova určena, to ještě víc rozzuřilo. Zároveň ale v jeho proslovu zazněla i věta, která vyvolala přesně tu reakci, jakou tehdejší prezident Obama zamýšlel. Řekl: „Američtí muslimové jsou naši přátelé, sousedé, jsou to naši spolupracovníci a sportovní hrdinové, a ano, jsou to i muži a ženy v uniformách, kteří jsou ochotní zemřít při obraně naší země.“ Po pronesení těchto tvrzení se poprvé za rok změnilo nejčastější podstatné jméno následující po „muslimský“ z „terorista“, „extremista“ či „uprchlík“ na „sportovec“ a „voják“. „Sportovci“ se dokonce udrželi na prvním místě ještě celý následující den. Což autor zobecňuje: „Jakmile se snažíme rozzlobené lidi poučovat, jejich zlost může ještě narůstat, jak naznačují data z vyhledávače. Pokusíme li se však jemně popíchnout jejich zvědavost tím, že jim poskytneme nějakou novou informaci nebo nabídneme nový pohled na skupinu obyvatel, která v nich zlobu vyvolává, můžeme jejich myšlenky či názory obrátit více pozitivním směrem.“

„Bůh mi pomáhej“ jako indikátor
Zcela jiná oblast výzkumu se týkala lexika, jejž použili žadatelé o finanční půjčky. Ti, kteří do svých textů zapojili výrazy jako „nižší úroková sazba“ či „po zdanění“, svoje závazky následně plnili. Naopak uvede li někdo ve své žádosti větu jako „slibuji, že vám všechno splatím, Bůh mi pomáhej“, pravděpodobnost, že to skutečně udělá, je podle autora minimální. A podobná situace nastává, pokud vás žadatel o půjčku prosí o slitování a vysvětluje například, že peníze potřebuje, protože jeho příbuzný je v nemocnici. „V podstatě jakoukoli zmínku o příbuzných, ať už jde o manžela, manželku, syna, dceru, matku či otce, lze považovat za znamení, že žadatel půjčku splácet nebude“, uzavírá Stephens-Davidowitz lakonicky.

Zbožnosti se částečně týkalo i jiné šetření, které zkoumalo, za jakých okolností se chudí lidé ve městě dožívají vyššího věku. Příčinou ovšem nebyla přítomnost mnoha zbožných lidí ani nízká hladina znečištění ovzduší, ale kupodivu to, že „ve městě žije hodně bohatých lidí“. Autor také předkládá možné vysvětlení spočívající v „nakažlivosti“ zdravých návyků, které jsou typičtější pro movitější občany. Chudí lidé žijící v blízkosti bohatých pak také sami víc cvičí, míň kouří a nebývají tak často obézní.

Obsáhlým tématem, jímž se autor zabývá, jsou pak partnerské a sexuální vztahy, jež řeší i na osobní rovině, protože minimálně v době psaní knihy zřejmě neměl tuto oblast uspokojivě vyřešenou. („Když je vám třiatřicet a na posledních několik oslav Díkůvzdání jste dorazili sami, je velice pravděpodobné, že se začne probírat otázka výběru ideálního partnera,“ svěřuje se, načež přibližuje, jakého typu rad se mu dostávalo od různých rodinných příslušníků.) Obecně ale sexuální spokojenost v partnerství nelíčí zrovna růžově. Termín „manželství bez sexu“ je dle něj vyhledáván třikrát častěji než „nešťastné manželství“ a osmkrát častěji než „manželství bez lásky“. Dokonce i nesezdané dvojice si docela často stěžují na to, že spolu nespí. Vyhledávaný termín „vztah bez sexu“ je hned na druhém místě za termínem „zneužívání ve vztahu“.

Těhotné manželky v transkulturním srovnání
Některá autorova srovnání ohledně našeho partnerského chování jsou opět geografická a transkulturní. Bádal například nad tím, jak se navzájem jednotlivé země liší v tom, jaká témata muži vyhledávají v kontextu se spojením „těhotná manželka“. V Mexiku žebříčku vévodí slovní spojení „láskyplná slova pro mou těhotnou ženu“ nebo „básně pro mou těhotnou ženu“. Kdežto ve Spojených státech jsou nejčastěji vyhledávány věty jako „žena je těhotná, co teď“ či „manželka je těhotná, co mám dělat“. Jinde srovnává muže a ženy podle toho, jak jsou podle něj vzájemně velkorysí. Jako měřítko si bere vyhledávání informací o tom, jak být lepší v orálním uspokojování partnera. V pomyslném klání vítězí ženy, a to v poměru dva ku jedné.

Autor nepředkládá jednotnou teorii lidského jednání a myšlení, spíše k sobě nesystematicky skládá jednotlivá zjištění ohledně velmi odlišných druhů lidských činností, na které se svým ekonomickým vzděláním není zrovna odborníkem. V tomto ohledu by se kusé údaje každé z jeho kapitol daly doplňovat zjištěními z jiných zdrojů, které by je zasazovaly do širšího kontextu a případně je mírně relativizovaly. (Řada studií například tvrdí, že navzdory všem proměnám a krizím, jimiž prochází současná manželství, si průměrní manželé užívají více sexu než svobodní lidé stejného věku.)

Jak je důležité míti psychologa
I když o nás digitální sítě zaznamenávají mnohé, jinou záležitostí je interpretace, které jsou u Stephens-Davidowitze někdy snad trochu příliš přímočaré. Pokud někdo do vyhledávače napíše „manželství bez sexu“, jak můžeme vědět, že nejde o vyjádření přání ženy, která se cítí být nároky manžela přetěžovaná, nebo dotaz ekologického aktivisty, jehož ideálem jsou vztahy, z nichž by se již nerodily další děti čerpající přírodní zdroje? Autor teoreticky uznává, že jeho data nejsou všeříkající a že ideální je kombinace malých a velkých dat. Zmiňuje, že i Facebook občas jako doplněk využívá průzkumy veřejného mínění. Facebookový tým odborníků prý zaměstnává také sociální psychology, sociology a antropology, aby našli, co sesbíraným datům chybí – ovšem na psaní této knihy se takový tým bohužel nepodílel.

Místo toho autor kritizuje, že světově nejproslulejší sexuologové „se stále drží svých osvědčených postupů. Několika set zkoumaných osob se zeptají na jejich touhy, a o data dostupná na stránkách, jako je Pornhub, se nezajímají. Světově nejproslulejší lingvisté analyzují jednotlivé texty; vzorce nalezené v miliardách knih ignorují“. I zde můžeme namítnout, že některé sociologické studie již dnes na Pornhub odkazují, a vznikají i samostatné obory jako komputační sociolingvistika, které se k využívání nových zdrojů digitálních dat stavějí pozitivně.

Další, do koho se autor mírně „naváží“, jsou beletristé. Jejich románové příběhy se mu totiž zdají „přízemní a nepřirozené“. Zatímco v jeho knize se nemusíme omezovat na jedinou konkrétní a nereprezentativní lidskou bytost, a „přesto můžeme vyprávět komplikované a barvité příběhy“. Takové tvrzení zní trochu nabubřele a autor sám ho relativizuje tím, že v knize cituje z románu Milana Kundery Nesnesitelná lehkost bytí: „Člověk nikdy nemůže vědět, co má chtít, protože žije jen jeden život a nemůže ho nijak porovnávat se svými předchozími životy, ani ho opravit v následujících. Neexistuje žádná možnost ověřit, které rozhodnutí je lepší, protože neexistuje žádné srovnání.“ Obecně s ním souhlasí, i když v některých oblastech nám data mohou dát obecnou odpověď například ohledně závažnosti výběru vysoké školy, který dle autora nemusí být příliš podstatný: „Faktory úspěchu jsou talent a chuť se prosadit. Ne to, kdo k vám promluví při příležitosti promoce, zahájení školního roku nebo další výhody, které nabízejí školy zvučných jmen.“

Celkově recenzovaná kniha představuje inspirativní výzvu k hledání možných interpretací předložených faktů i užitečný poukaz k existenci celého oceánu dat, s nimiž se vědci zatím jen postupně a nesměle učí zacházet. I když s autorem v jednotlivostech polemizujeme, jejich zveřejnění je samozřejmě lepší variantou než inkriminované údaje využívat k zasílání cílené komerční reklamy nebo k vytipovávání voličů náchylných k tomu, aby podlehli konspiračním teoriím. V tomto smyslu jsou důležité i Stephens-Davidowitzovy poznatky o způsobech účinného boje proti rasovým předsudkům, i když obecně platí, že tato data a vše, co se z nich dá vyčíst, jsou dvousečné zbraně, a to velmi ostře nabroušené. Jak je ostatně vidět na příkladu firmy Cambridge Analytica, jejíž datově analytické nástroje byly podle jejího bývalého zaměstnance Christophera Wylieho původně vyvíjeny s cílem efektivnějšího boje proti extremismu a proti šíření radikálního islamismu. Po změně vlastníků ale tytéž metody zřejmě přispěly k vítězství Donalda Trumpa…

 

Kupte si knihu:

Podpoříte provoz našich stránek.

Recenze

Spisovatel:

Kniha:

Seth Stephens-Davidowitz: Všichni lžou. Velká data, chytré algoritmy a jak nám internet může říct, kdo opravdu jsme. Přel. Romana Hegedüsová, Host, Brno, 2019, 340 s.

Zařazení článku:

sociologie

Jazyk:

Země:

Hodnocení knihy:

80%