Silver, Nate: Signál a šum

Statistika nuda není

Kniha Signál a šum amerického odborníka na statistické analýzy a vytváření predikcí Nata Silvera, kterou letos vydalo nakladatelství Paseka, je výjimečným příkladem populárně naučného díla, které je nejen teoreticky zajímavé, ale pro řadu odborných i laických čtenářů také prakticky velice užitečné. Autor v ní na mnoha příkladech z rozmanitých oblastí ukazuje, kterak fungují, či spíše nefungují expertní předpovědi.

Čísla sama nemluví
Ať již jde o chybnou předpověď vývoje trhu, či výsledků baseballových utkání, příčinu selhání lze zpravidla umístit do kolonky „lidský faktor“. Známé IT pořekadlo „garbage in, garbage out“ (špatná data na vstupu, špatná data na výstupu), zprošťuje počítače veškeré zodpovědnosti za jejich výsledky. Jako mylný předpoklad autor uvádí výrok Chrise Andersona, editora časopisu Wired, že obrovské množství dat, které díky rychlému rozvoji internetu a výpočetní techniky narůstá geometrickou řadou, nás nakonec zprostí potřeby vymýšlet teorie i vědeckou metodu, jelikož za nás všechno srovnají a vyhodnotí stroje. Silverova námitka je lapidární: „Čísla sama nemluví.“ Vždy jde především o to, odlišit signál od šumu, tedy relevantní data, jež ovlivňují sledovaný jev, od těch nepodstatných, zavádějících. Zdaleka ne vždy je to snadné.

Každá kapitola knihy představuje jiný prediktivní problém. Nate Silver nás postupně provádí tak rozličnými oblastmi, jako jsou akciové trhy, počasí, předvídání zemětřesení, hurikánů, sportovních výsledků, politických klání, strategií pokeru, vývoje epidemií, počítačových šachů, globálního oteplování i hrozby teroristických útoků. Úspěchy v předpovídání jsou různé, nedostatek sebekritiky, neopodstatněný optimismus spolu s nedostatečným množstvím dat či špatně sestaveným statistickým modelem však často vedou ke zcela nereálným výsledkům. Nutno dodat, že autor má sám s některými oblastmi značné osobní zkušenosti. Na své webové platformě FiveThirtyEight.com v prezidentských volbách v roce 2008 správně předpověděl 49 vítězů z 50 států USA a dalece tak předčil uznávané televizní tváře z řad politologických expertů. Úspěšně se také věnoval analýze baseballových utkání a hraní pokeru.

Model kočky není kočka
Obtíže s předpovídáním lze dobře demonstrovat na příkladu počasí. Slavná teorie chaosu, formulovaná v roce 1972 vědcem z MIT Edwardem Lorenzem, jež se zpravidla pojí s metaforicky formulovaným efektem motýlích křídel, zjednodušeně řečeno vyjadřuje, že jestliže je systém nadmíru složitý a citlivý pro nejmenší změny, je i přes celkem snadnou měřitelnost vstupních údajů v zásadě nemožné vytvořit přesný model. I zaokrouhlení jedné tisíciny atmosférického tlaku může ve výpočtu počasí způsobit velké změny. Narůstání prediktivní chyby je samozřejmě přímo úměrné času – dlouhodobější předpovědi proto téměř ztrácejí význam. V samotné prezentaci výsledků navíc hraje roli řada psychologických faktorů. Televizní stanice například běžně uplatňují tzv. zamokřování: pokud je například pravděpodobnost deště půl na půl, zpravodajství dává přednost dešti. Informace, že k něčemu dojde na 50 %, vyznívá jako neschopnost dodat jasnou předpověď (byť by byla sebepřesnější). Diváci si navíc spíš zapamatují, jestliže zmoknou, když nemělo pršet, než opačně, tudíž se zde skepticismus stanic pro udržení důvěry vyplácí.

U předpovědí jde zpravidla o vytvoření simulovaného systému, který bude co nejlépe kopírovat měřené parametry v jejich vývoji. Ve snaze o maximální přesnost však může snadno dojít k tomu, že se prediktivní model „přeučí“ – tedy že kopíruje i naměřený šum obsahující nepodstatné a zavádějící informace. Důležité je v tomto případě neztratit ze zřetele, že předpovědní model je třeba verifikovat porovnáním jeho výsledků s budoucím vývojem, nejen s údaji nashromážděnými z minulých měření. Zdá se to být samozřejmé, ale často tomu tak není. Žádná simulace však není dokonalá – jak řekl Norbert Wiener, otec kybernetiky: „Nejlepší model kočky je kočka.“ Abychom tedy mohli simulovat skutečnost zcela věrohodně, museli bychom vymodelovat realitu samotnou. Situace by tak připomínala povídku Jorgeho Luise Borgese o kartografech, jejichž řemeslo dosáhlo takové dokonalosti, že vytvářeli mapy v poměru 1:1, takže ty pokrývaly svou rozlohou celou zemi. V případě počasí je každopádně důležité porovnat účinnost předpovědi vůči persistenci a klimatologickým záznamům. To znamená, že predikce by měla být lepší než prostý odhad na základě minulých dnů či podle průměrných údajů sesbíraných v rámci dlouhodobých měření pro daný den a dané místo.

Teorie relativity
Stěžejní bod Silverovy argumentace pak vychází z psychologických studií Philipa E. Tetlocka. Tetlock cituje starověkého básníka Archilocha: „Liška ví hodně, ježek jedno, velké však.“ Na základě jeho věty dělí experty na tyto dvě „zvířecí“ kategorie. Ježci jsou fanatici jedné velké teorie, které často veškeré pozorování přizpůsobují, zatímco lišky jsou eklektici – skeptičtí k jednomu východisku, k jedné možné interpretaci, skládají střípky empirických dat do celkového obrazce, jenž je utvářen vhodnými teoretickými modely užitými spíše ad hoc. Lišky si zachovávají odstup a nebojí se pod tlakem nových pravd svůj náhled změnit. Zřejmě není třeba příliš zdůrazňovat, že autor sám sebe řadí mezi ně. Zkreslení lidského úsudku přehnaným sebevědomím a neschopností vidět věc jinak než jedním dominujícím prizmatem zásadně ovlivňuje způsobilost prognózy. Jako dostatečně ilustrativní je v tomto směru autorem zmiňovaný fakt, že zprůměrovaná hodnota všech dostupných expertních předpovědí týkající se určitého tematického pole často poskytuje o 15–20% lepší výsledek než prognózy samotné. Jednotliví experti jsou tedy spíše ježkové. Je ovšem výrazně spolehlivější liščím způsobem relativizovat a využít maximum dostupných náhledů.

Individuálním oblastem pak přísluší specifický vliv lidského faktoru. Například zainteresovaní experti na vývoj finančního trhu mají tendenci bagatelizovat míru rizika, jelikož prostředí je nastaveno spíše na krátkodobé výdělky než dlouhodobé plánování. Pokud se jejich odhad potvrdí, vydělají; když ne, nebude to tak hrozné, jelikož v tom nebudou sami. Míra pospolitosti zde hraje prim. Naopak ten, kdo půjde skepticismem proti proudu, riskuje, že jej převálcuje nebojácná konkurence. Politické odhady jsou dle Silverových slov většinou zcela mimo – předpovědi expertů mohou být horší než házení mincí, přesto si mohou získat značné renomé. Odvážná předpověď, která se potvrdí, získává vždy větší popularitu než realistický náhled. Když to nevyjde, nic se neděje, vždyť omylní jsou všichni. Zásadní roli tedy hraje též zodpovědnost a zapomnětlivost. U lékařských diagnóz nebo u epidemií, povodní či hurikánů, tedy tam, kde jde o lidské životy, jsou předpovědi zpravidla uváženější a mnohem realističtější. Kde naopak bezprostřední nebezpečí nehrozí, působí situace na mnoho prognostiků jako nezávazná hra, kde lze hodně vyhrát, ale prohra nic nestojí. Vystřízlivění z hráčského snu a tvrdý dopad reálných důsledků nastává tehdy, když praskne třeba ekonomická bublina. Že mylný odhad dopadne především na ty, kteří „velkými hráči“ nejsou, není třeba připomínat.

Vědecká vlčí mlha
Problém však nastává i všude tam, kde je dat málo a kde se těžko rozlišuje, co je šum a co relevantní informace: od vývoje epidemií až po globální oteplování, u něhož se sice většina expertů shodne, že existuje, ale už ne na tom, jak vážný problém skutečně představuje. Pokud se bez kritického nadhledu uchýlíme pouze k prokládání informací – srovnávání trendů a hledání vzorců napříč datovým polem, čili budeme porovnávat mraky dat mezi sebou, můžeme sice dojít k celé řadě fantastických poznání (autor uvádí příklady jako třeba korelace mezi změnou chování sumců či ropuch a zemětřesením nebo mezi vzrůstem kriminality a rozšiřováním supermarketů), ale v zásadě může jít o nesmysly. Snaha o eliminaci lidského vhledu, jež vede k strojové aplikaci srovnávacích analýz, se pak blíží spíše vědeckému věštění z kávové sedliny – vidíme, co chceme vidět. Lidský faktor tedy vždy hraje určující roli; často vede k fatálním omylům, ale bez něj to nejde o mnoho lépe. Postupné zlepšování musí probíhat s vědomím vlastní omezenosti. Jedině sebekritičnost vede k rozumným výsledkům a je nástrojem, jak se vyhnout vědecké vlčí mlze.

Leckomu se snad může zdát autorova snaha vše převádět na řeč statistiky poněkud redukující, ovšem jak plyne z výše řečeného, Silverovi nechybí odstup od zaslepené aplikace „tvrdých“ věd. Autor se snaží síly vědeckého poznání nepřeceňovat, analyzovat nedostatky a vnést do věci étos postupného zlepšování za bohulibým účelem lidského rozvoje. V dnešní datové džungli, v níž se leckdo špatně orientuje a která dává prostor řadě šarlatánů a paranoiků, ale i nabubřelým odhadům sebevědomých expertů, spekulantů či do sebe zahleděných ježků, je takových knih potřeba. Věda, jež už před drahnou dobou přestala být nástrojem k poznání „Božího díla“, se stala mašinerií, u níž není vždy jasné, zda ještě slouží skrze technologii ideálům humanismu, či je již vznášející se Laputou odmítající filozofické ukotvení. Je ovšem stejně jako oheň dobrým sluhou – k tomu, abychom jí zabránili rozšířit dusivé plameny do celého domu poznání, lze výborně použít její vlastní kritické nástroje.

Co se týče českého překladu, až na pár drobností je obstojný. Překladatel neortodoxně skloňuje složité číslovky dle současného, především v masových médiích rozšířeného trendu, který je ovšem dle aktuálních pravidel považován za spisovný (např. tisíc sedm set třicátý místo tísící sedmistý třicátý). Na straně 263 je věcná chyba, kdy se píše „dvaasedmdesátiletého Poea“ – jak je známo, E. A. Poe se tak vysokého věku bohužel nedožil (1809–1849).