Recensie: Het waarom achter de statistiek

06 september 2018 , door Joey de Gruijl
| | |

Weinig vragen zijn zo vaak gesteld als de waaromvraag. Het is een vraag die, goed beschouwd, de bakermat vormt van de religieuze praktijk, de wetenschap en betekenisgeving in de breedste zin des woords – waarom? Grofweg: het antwoord op een waaromvraag geeft wezenlijk inzicht in de aard en oorzaak van het bevraagde, en leidt als zodanig tot substantiële kennis van de materie. Zonder waaromvraag geen duiding. En het is de waaromvraag die ten grondslag ligt aan The Book of Why: The New Science of Cause and Effect (2018) van Judea Pearl en Dana Mackenzie, dat een heldere inkijk geeft in de geschiedenis van het denken over causaliteit – en in causaliteit zelf.

Pearl, verbonden als hoogleraar Computer Science & Statistics aan UCLA, is een van de belangrijkste statistici van de afgelopen decennia. Zijn Causal Bayes Nets zijn baanbrekend geweest binnen de velden van de statistiek en artificiële intelligente, wat hem onder meer de Turing Award heeft opgeleverd. Wellicht bekender nog is de auteur van zijn prominente stellingname in het Frequentism-Bayesianism debat over statistiek in de jaren tachtig, een stellingname waarbij zijn theoretische uitgangspunten zijn verheven tot een welhaast religieuze aangelegenheid – Judea-ism. Samen met mathematician-turned-science writer Mackenzie stelt Pearl zich ten doel zijn levenswerk behapbaar te maken voor een breder publiek: hoe kunnen we wetenschap en statistiek inzetten om de vraag waar het uiteindelijk om draait – waarom? – te beantwoorden op een wetenschappelijk rigoureuze wijze?

Over Pearl – maar ook over statistiek

The Book of Why laat zich lezen als een geschiedenis van het idee van causaliteit binnen de wetenschap, maar is meer dan dat. Het is bovenal een voortreffelijke uiteenzetting van Pearls eigen uitgangspunten, en de gedachtegang achter de causale modellen waar hij zijn leven lang aan gewerkt heeft. Het boek geeft daarmee voornamelijk een antwoord op de waaromvraag à la Pearl en biedt in mindere mate inzicht in de posities van zijn theoretische aartsrivalen, die op polemische wijze weggezet worden als ‘kinderen van hun tijd’, niet zelden door gebruik van stropoppen.

Zo wordt R.A. Fischer, bekend van zijn bijdrage aan statistische significantietests, op anekdotische wijze weggezet als stuurs figuur, en wordt de suggestie gewekt dat zijn rookgedrag van invloed is geweest op zijn ongeloof in roken als oorzaak van de ontwikkeling van kanker. Maar de polemische toon leidt niet af van het hoofddoel van het werk. Op zeer heldere wijze krijgt Mackenzie, als ghostwriter van Pearl, het voor elkaar een begrijpelijk overzicht te geven van een zeer ingewikkeld vakgebied en dito onderwerp, vol verduidelijkende voorbeelden en biografische details over belangrijke statistici. De auteur is erin geslaagd een boek te schrijven dat zich laat lezen zonder dat er veel voorkennis over het onderwerp verondersteld wordt. Dat laatste is overigens hoognodig, voor een auteur die bekend staat om zijn claim dat ‘formulas are baked cookies, words are cookies in the oven’.

Formele inslag

Daarmee is niet gezegd dat The Book of Why een makkelijk boek is. Hoewel de opbouw gestructureerd en goed te volgen is, moet je aandachtig blijven lezen. Niet zelden verwijzen de auteurs terug naar schijnbaar kleine theoretische punten eerder in het boek, en eens uitgelegd wordt verondersteld dat de lezer de (vaak wiskundige) gedachtegang kan volgen. Het is duidelijk dat de auteurs een publiek met sterke formele intuïties voor ogen hadden. Het boek voelt daarom ‘wetenschappelijker’ aan dan veel populairwetenschappelijke literatuur, iets wat zowel een kracht als een zwakte is. Zwakte omdat het sommigen zal doen afhaken na het eerste hoofdstuk, kracht omdat het boek meer biedt dan een summiere easy-read over een onderwerp dat complexer is dan menig populariserend auteur wil doen geloven.

De sterk formele inslag van het boek heeft verder als voordeel dat, hoewel weinig vernieuwend voor ingewijden in de bèta-wetenschappen, het lezers met een achtergrond in de maatschappij- en geesteswetenschappen een inzicht biedt in een vakgebied dat voor velen van hen abstract is. De hoofdgedachte door het boek heen is dat ieder (statistisch) model een voorafgaande causale intuïtie nodig heeft. Hoe triviaal dit ook klinkt, zulke causale intuïties zijn cruciaal voor het opstellen van een juist model, en vaak lastiger te vinden en te modelleren dan men zou denken.

Ideale inleiding

Het boek laat vervolgens zien hoe, en vooral hoe niet het modelleren van causale modellen mogelijk is, vanuit een voornamelijk formele invalshoek. De vele voorbeelden in het boek laten daarbij zien hoe een goede wetenschappelijke intuïties door verkeerde toepassing van methoden desondanks tot slechte wetenschap kan leiden. Zo heeft het boek bijvoorbeeld een hoofdstuk volledig gewijd aan veelvoorkomende statistische paradoxen, die in de praktijk vaak niet gezien of simpelweg ontkend worden.

Het boek zou daarom niet misstaan in legio eerstejaarsvakken methodologie. Aan de andere kant van het spectrum, voor lezers met een bèta-achtergrond, is de belangrijkste take-away message de grote aanklacht tegen het ‘all is data’-denken dat momenteel lijkt te heersen in de informatie- en computationele wetenschappen. Goed beschouwd kan The Book of Why ook gelezen worden als een manifest voor het belang van wetenschapsfilosofische reflectie op modelmatig bèta-denken, en het algemene belang van de alfawetenschappen – júíst binnen die contreien.

Al met al hebben Pearl en Mackenzie een formidabele introductie in een zeer complex vakgebied afgeleverd. Leesbaar maar inhoudelijk, zowel breed als verdiepend waar nodig. De vele (reken)voorbeelden maken het boek begrijpelijk en ze zijn nooit overdadig, maar altijd illustratief voor het verhaal. De anekdotische en biografische schrijfstijl maken dat The Book of Why meer biedt dan slechts een opsomming van statistische ontwikkelingen, maar ook een levendig boek dat aantrekkelijk is om te lezen. Ironisch genoeg beantwoorden de auteurs uiteindelijk niet de vraag wat causaliteit nu is, maar desondanks is The Book of Why een aanrader voor eenieder die geïnteresseerd is in de how-to van causale vraagstukken binnen de wetenschap en diens praktijk.

Joey de Gruijl is masterstudent filosofie en logica aan het Institute for Logic, Language and Computation (ILLC) en schrijft een masterthesis over causale interpretaties van statistische modellen.

Delen op

Gerelateerde boeken

pro-mbooks1 : athenaeum