Biologiske fallgruver – eller hvorfor mange hater statistikk

Statistikk er ikke et enkelt fagfelt. Det er lett å se systemer og sammenhenger som ikke nødvendigvis er der, og det kan være vanskelig å finne de sammenhengene man skulle ønske lå til grunn. Utallige antall studenter har gjennom tidene sittet og forbannet statistikkfaget for at det er så lite samarbeidsvillig. Men hva er det som gjør statistikk såpass vanskelig?

En del av svaret ser ut til å være så grunnleggende som menneskelig biologi.

Men før jeg legger ut om dette vil jeg gjerne snakke litt direkte til deg.

Ja, deg ja.

Jeg har nemlig gjort litt research på hvem leserne mine er, og tror jeg har ganske god oversikt. Jeg skal dermed forsøke å beskrive nettopp deg, kjære leser, med et kort lite avsnitt. Jeg beklager hvis dette blir litt personlig.

Du har et stort behov for at mennesker skal like og beundre deg. Du har en tendens til å være selvkritisk. Du har en stor porsjon ledig kapasitet som du ennå ikke har dratt fordel av. Selv om  du har enkelte svakheter i din personlighet, har du i all vesentlighet evnen til å kompensere for disse. Utenpå er du disiplinert og underlagt stor selvkontroll, men innvendig bekymrer du deg i større grad, og er usikker. Du tviler iblant sterkt på om du har tatt de riktige beslutningene, og gjort det som er riktig. Du foretrekker en viss grad av variasjon, og blir lite tilfreds når du blir hemmet av begrensninger og bestemmelser. Du vurderer deg selv som en selvstendig tenker og godtar ikke andres uttalelser uten tilfredsstillende bevis. Du har funnet ut at det ikke er lurt å være for direkte i utleveringen av seg selv i omgang med andre. Til tider er du utadvendt, omgjengelig og sosial, mens du andre ganger er innadvendt, skeptisk og reservert. Enkelte av dine ønsker kan være ganske urealistiske. Sikkerhet er et av dine store mål i livet.

Forvirra? Jeg kommer tilbake til dette om litt.


System 1 og 2

Økonomen Daniel Kahneman fikk i 2002 nobelprisen i økonomi (eller Sveriges Riksbanks pris i økonomisk vitenskap til minne om Alfred Nobel, for kverulantene der ute) for arbeidet sitt innenfor beslutningsteori – hvordan mennesker tar de valgene de gjør. Han ga i 2011 ut den bestselgende boken Tenke, fort og langsomt, hvor han presenterte en del av tankene sine,  og hvor han deler menneskelig bevissthet i to deler, system 1 og 2.

System 1 er automatisk, raskt og uanstrengt – vi er som regel ikke klar over at vi bruker det. Det er dette vi omtaler som intuisjon eller instinkt. Det er sterkt påvirket av humør og emosjonell tilstand, og benytter seg av snarveier og sammenhenger for å jobbe kjapt og effektivt. Fordi det er såpass raskt og emosjonellt kan det ofte medføre alvorlige feil i resonnementet vårt. «Fort og gæli'» er en god beskrivelse.

System 2 er det kognitive tankesystemet – bevisst tankegang. Det er dette vi benytter i klasserommet, når vi jobber bevisst med oppgaver. Det er tungt og resonnert, tregt og logisk, progressivt og selvbevist. Det gjør færre feil enn det instinktive systemet, og siden vi vet hvordan vi har nådd en konklusjon kan vi jobbe oss bakover i beslutningsprosessen og rette egne feil.

Mange av feilene som oppstår ved behandling av tall og statistikk kommer av at vi benytter system 1 istedet for 2. Dette skjer nettopp fordi et av kjennetegnene ved system 1 er at vi ikke vet vi benytter det. Vi når et svar og en konklusjon uten å vite hvordan vi fant den.

Det er en veldig god grunn til dette. Hadde det ikke vært for vår utbredte bruk av system 1 hadde antageligvis få av oss vært her idag. Dersom forfedrene våre hadde stoppet og vurdert hvorvidt sabeltanntigeren var en trussel, istedet for å løpe, hadde vi ikke eksistert. System 1 er  designet for rask vurdering av omgivelsene våre, og hurtig respons. Det er det som får oss til å løpe når vi oppdager at vi er i trøbbel. Så når man i matematikk eller logiske problemer trekker en rask og feilaktig konklusjon er det fordi system 1 ønsker å gi oss en hurtig løsning, for å hjelpe oss ut av problemet. Som ironisk nok ofte bare leder til mer problemer.

Dessverre sliter vi med å bruke system 2 like aktivt som vi gjerne skulle, uten å behøve en ferie etterpå. Det er tungt å skulle bevisst resonnere seg frem. Det er slitsomt. Det hender også at vi tar intuisjonen vår for god fisk, at vi rett og slett glemmer kritisk gransking. Konsekvensen av dette er at vi i stor grad lener oss på system 1 – og dermed begår en rekke åpenbare feil i resonnementene våre.  Jeg har lyst til å skrive litt om to konkrete feil, bekreftelsestendens og narrativ feilslutning, som er spesielt utbredte.

Bekreftelsestendens

Bekreftelsestendens (på engelsk: confirmation bias) omhandler at vi har en tendens til å søke informasjon som bekrefter tankene våre. Dette kan  medføre at vi velger å utelate informasjon som strider med det vi tror stemmer, og dermed styrke en ubegrunnet antagelse. En person som er for strengere våpenkontroll vil søke etter nyheter og personer som støtter sitt eget synspunkt. Etter en skyteepisode vil personen velge å tolke informasjonen om hendelsen på en måte som støtter opp under tankene om at strengere våpenkontroll er viktig. F.eks

«Hadde vi hatt strengere våpenkontroll ville færre personer fått tak i våpen, og det ville blitt færre skyteepisoder.»

En person som er mot våpenkontroll vil derimot oppleve akkurat samme effekten, men i motsatt retning. Personen vil oppsøke nyheter og personer som favoriserer sitt eget synspunkt. Etter samme skyteepisode vil samme personen tolke informasjon i et lys som favoriserer mildere våpenkontroll. F.eks

«Hadde vi hatt mildere våpenkontroll hadde flere personer kunne beskyttet seg selv effektivt, og det vill blitt færre skyteepisoder.»

«Men Martin,» tenker du kanskje, «dette er jo ikke feilaktig – det er jo bare forskjellige meninger?» Jo, det er i for seg sant. Problematikken ligger dog i at de to personene har blitt utsatt for den samme informasjonen, men likevel klart å trekke to vidt forskjellige konklusjoner, ved å velge ut de bitene av informasjonen som best stemmer overens med egne teorier.

Det finnes bedre eksempler; en arbeidsgiver som har fått godt inntrykk av en jobbsøker vil ubevisst lete etter positive elementer i cv’en som støtter inntrykket av at søkeren er en god kandidat. En forelsket person vil lett kunne se de gode sidene hos kjæresten sin, og ubevisst undertrykke de negative sidene. Bekreftelsestendens er også en av journalistens verste fiender. Ved å publisere korrekte fakta, men uten å publisere alle relevante fakta, kan journalister lett gi et misvisende bilde av en situasjon eller nyhet. Det er ikke nødvendigvis slik at journalisten aktivt velger å favorisere en side i en sak, men inntrykket vris for det.

«Personen i bilen hadde drukket en flaske vodka en time før ulykken.»

«Personen i bilen hadde drukket en flaske vodka en time før ulykken på parkeringsplassen der han hadde parkert.»

Det er opplagt at utelatelse av informasjon kan sterkt endre oppfattelsen av situasjonen.

Bekreftelsestendens ser ut til å kunne forklare et par interessante fenomener, blant annet horoskop og ekstrasensorisk persepsjon (ESP). Ta for eksempel beskrivelsen jeg ga av deg, helt i starten av innlegget. Hvordan syntes du den traff? Du er antageligvis skeptisk til å begynne med når du leser det – jeg har jo ingen mulighet til å vite akkurat hvem du er, eller hvordan du er – men sannsynligheten er ganske høy for at du kjente deg igjen i store deler av beskrivelsen. Dette er den såkalte Forer-effekten, som forklarer hvordan personlige horoskop kan oppfattes som spesielt treffende. Poenget er at teksten er skrevet spesielt vagt og generelt; hvem har vel ikke opplevd at de fremstår som mer selvsikre enn de egentlig føler seg? Bekreftelsestendsen slår til igjen!

ESP fungerer tilsvarende. Jeg har en venn som hevder han alltid vet når faren holder på å ringe – han tenker på faren sin – også ringer han! Hvor magisk er ikke det? Dessverre, veldig lite magisk. Bekreftelsestendensen gjør at vi husker de tilfellene hvor vi har opplevd dette – tenkt på pappa rett før han ringer. Men hva med alle gangen man har tenkt på far, og telefonen ikke har ringt? Eller de gangene far har ringt, og man ikke har tenkt på han? Vi har en evne til å sile ut de tilfellene som best passer overens med konklusjonen vår.

Fysikeren Richard Feynman er (blant veldig mye annet) kjent for å ha latterliggjort denne typen posteriori konklusjon,

«You know, the most amazing thing happened to me tonight… I saw a car with the license plate ARW 357. Can you imagine? Of all the millions of license plates in the state, what was the chance that I would see that particular one tonight? Amazing!»

Bekreftelsestendens er en logisk feilslutning. Den gjør oss sårbare fordi det undergraver beslutningsgrunnlaget vårt. Bekreftelsestendens kan enkelt lede til det Nassim Taleb i The Black Swan henviser til som «The Round-trip Fallacy», hvor utelatelse av avkreftelse leder oss til å tro at vi har en bekreftelse, med alvorlige logiske feil. I enkle eksempler kan det være lett å se feilen, men i mer komplekse situasjoner blir det langt verre.

Se for deg at jeg ligger utstrakt på togskinnene mellom Oslo og Trondheim i 5 timer en søndag ettermiddag. Etter fem timer reiser jeg meg og sier, «Se! Jeg ble ikke overkjørt, ergo er det ufarlig å ligge på togskinner». Dette er åpenbart en feilaktig slutning. Bare fordi jeg ikke ble overkjørt i mitt spesifikke utvalg (fem timer på en søndag) kan jeg ikke slutte at togskinner i sin helhet er ufarlige. Det vil faktisk være umulig for meg å bekrefte denne slutningen på denne måten. Dette går tilbake til den vitenskapelige metode – vi kan ikke med sikkerhet bevise at togskinner alltid er ufarlige. Vi kan hypotisere det. Vi kan etter tre dager på togskinnene uten å bli overkjørt anta at det er trygt. Det er først når toget treffer oss en uke senere at vi med sikkerhet kan si at togskinner ikke er trygge å ligge på. Men på dette tidspunktet er det kanskje ikke så relevant lenger.

Poenget er at vi ikke kan bekrefte noe ved å utvide samplet, men vi kan avkrefte ved kun en observasjon. Det kalles ofte negativ empiri.

Om jeg følger en mann på åpen gate i Oslo kan jeg ikke slutte «jeg har ikke sett mannen drepe noen – ergo er han ikke en morder». Jeg kan følge vedkommende i to måneder uten å se han myrde noen, og det vil fremdeles ikke være nok til å si med fullstendig sikkerhet at han ikke er en morder. Det er først når han brutalt knivstikker og dreper meg dagen etter at jeg med sikkerhet kan si at han er en morder (dog en veldig tålmodig en), siden jeg har avkreftet at han ikke er en morder.

Dette kan fort bli vanskeligere i mer kompliserte situasjoner. Ta en titt på de to følgende setningene.

Det foreligger ikke bevis for at dette er en finanskrise. 

Det foreligger bevis for at dette ikke er en finanskrise. 

Setningene er veldig lette å blande, og slutningen vi foretar kan lett blandes. Likevel er de veldig forskjellige.

Hva med de følgende setningene?

Det er ingen bevis på kreft i kroppen.

Det er bevis på ingen kreft i kroppen. 

Det er usannsynlig, dyrt og tidskrevende å sjekke hver celle i kroppen for kreft. Man er dermed nødt til å ta et utvalg, og undersøke dette for kreft. Det er her de to setningene er veldig, veldig forskjellige. Den første setningen sier at det ikke er blitt oppdaget noen kreft, men man har ikke utelukket at det kan være det for det. Den andre sier med fullstendig sikkerhet at det ikke er kreft i kroppen. Setning nummer to tilsier at hver eneste celle er blitt bekreftet fri for kreft.

Ved rask intuisjon er det veldig lett å blande disse to, men dette kan medføre alvorlige logiske brist. Et siste eksempel:

De fleste terrorister er muslimer

De fleste muslimer er terrorister. 

Her burde det være opplagt at setningene betyr to veldig forskjellige ting, og konsekvensen av å blande de to er enorm. Hvis vi antar at den første setningen er sann, at 99% av terrorister er muslimer, betyr dette at omtrent 0.001% av muslimer er terrorister, siden det finnes godt over 1 milliard muslimer i verden, og la oss anta 10.000 terrorister – 1 i 100.000. Så den logiske feilen å blande disse to utsagnene får deg til å overestimere sannsynligheten for at en tilfeldig utvalgt muslim er terrorist med en faktor på nesten 50.000!  Konsekvensen av å blande to ord kan bli at hele folkegrupper, etniske minoriteter og religioner utsettes for diskriminering og stereotyper basert på et helt minimalistisk grunnlag.

For ordens skyld, det blir som å si, «Jeg møtte en nordmann en gang som var drittsekk, så alle nordmenn må være drittsekker.» 

Rent logisk er disse eksemplene forskjellen på implikasjon og ekvivalens; alle A er B, men alle B er ikke A. Om en franskmann er pyroman kan vi ikke anta at alle franskmenn ønsker å brenne ned alt. Det burde være opplagt at det er en feilaktig slutning, men system 1 hopper inn for å redde oss – og lurer oss inn i en falsk sikkerhet.

Narrativ Feilslutning

Mennesker liker historier, vi liker sammenhenger. Hjernene våre jobber konstant for å finne sammenhenger mellom ting for å forenkle verden rundt oss. Hvis jeg ber deg huske nummerrekken «123456789» burde ikke det være noe problem. Det er jo bare hvert tall,  i stigende rekkefølge. Enkelt. Ber jeg deg derimot om å huske «926173845» vil de aller fleste slite betydelig mer. Det er like mange tall, så det burde være tilsvarende like enkelt – men mangelen på en sammenheng og et system gjør at vi sliter.

Vi er rett og slett glad i å komprimere verden rundt oss, ved å bruke huskeregler. Vi er avhengig av disse huskereglene og sammenhengene våre.  Les setningen under.

A BIRD IN THE

THE HAND IS WORTH

TWO IN THE BUSH

La du merke til at det ene ordet er skrevet to ganger? Faktum er at hjernene våre konstant jobber for å rette feil og finne sammenhenger. Dermed kan vi lett la oss lure.

Det er dette som er narrativ feilslutning. Ved å kategorisere verden, og trekke linjer mellom forskjellige situasjoner har vi lett for å la oss lure, og anta ting som mer eller mindre sannsynlig enn det enkel logikk tilsier. Vår systematisering av verden forandrer oppfatningene våre av den.

Vurder eksperimentet gjennomført av Kahneman og Tversky, hvor en rekke statistikere ble bedt om å gjette sannsynligheten for at de to følgende situasjonene oppstår:

  1. En enorm oversvømmelse et sted i Amerika medfører at over 10.000 personer dør.
  2. Et jordskjelv i California medfører store oversvømmelser, som tar livet av mer enn 10.000 personer.

Mange svarte at tilfelle nummer to er langt mer sannsynlig enn det første. Men faktum er at det første tilfellet inkluderer tilfelle nummer to, og mer til. Fordi vi får satt en klar sammenheng, en fortelling og forklaring, regner vi situasjon nummer to som mer sannsynlig – enda det burde være opplagt at dette ikke er tilfellet. Selv drevne statistikere lar seg rive med!

Tilsvarende for de følgende to setningene, hvilken situasjon fremstår som mer sannsynlig?

Kristian var lykkelig gift. Han myrdet kona si.

Kristian var lykkelig gift. Han myrdet kona si for å få arven hennes.

Setning nummer to virker langt mer sannsynlig intuitivt, nettopp fordi mordet begrunnes. En lykkelig gift man myrder ikke kona si uten videre, det er mer forståelig i situasjon nummer to. Men faktum er at setning nummer en inkluderer mord for arven hennes,  mord fordi kona var utro, mord fordi Kristian var gal og mer til – og er dermed langt mer sannsynlig. System 1 tar likevel snarveien, og gjør at intuisjonen vår tar feil.

Når en gjøres klar over hvilken effekt system 1 har på de logiske slutningene våre, er det enkelt å rette sine feil. Den intuitive feilen begåes ofte fremdeles, men om vi benytter resonnert, logisk gjennomgang kan vi lære å se feilene vi gjør. Ihvertfall til man pakker sammen for dagen, og vandrer hjemover.

Denne typen tankegang er veldig domenespesifikk kunnskap – vi benytter den i en fast etablert omgivelse eller situasjon, og ignorerer den ellers.  Evnen til å se og rette logiske feil i klasserommet, er som oftest bedre enn når vi konfronteres med samme feilen i hverdagen. Da har vi en tendens til å kaste fra oss all faglig vekt, og følge instinktet. Som selvfølgelig gjør av vi tar feil, nok en gang. Dette forklarer hvordan selv drevne empirikere og statistikere kan la seg lure i hverdagslige sammenhenger.

Kort oppsummert så er mennesker dårlig egnet statistikk. Biologisk sett er vi bedre på rask respons enn grundig, logisk gjennomgang av teoretiske problem. Og godt er det – hadde vi vært like godt utviklet for dette som impulsiv slutning hadde vi alle vært prehistoriske snacks.

Reklamer

One thought on “Biologiske fallgruver – eller hvorfor mange hater statistikk

Legg igjen en kommentar?

Fyll inn i feltene under, eller klikk på et ikon for å logge inn:

WordPress.com-logo

Du kommenterer med bruk av din WordPress.com konto. Logg ut /  Endre )

Google+-bilde

Du kommenterer med bruk av din Google+ konto. Logg ut /  Endre )

Twitter-bilde

Du kommenterer med bruk av din Twitter konto. Logg ut /  Endre )

Facebookbilde

Du kommenterer med bruk av din Facebook konto. Logg ut /  Endre )

w

Kobler til %s