Om synkroniserte hjerter og bursdagsproblemet

En av fordelene ved å være glad i sære matematiske sammenhenger er at man ofte blir stilt interessante spørsmål. Spørsmål sånn som dette:
Du, mattegeniet, kunne du gjort meg en tjeneste? Jeg trenger litt hjelp med sannsynlighetsberegning for hvor mange hjerter som slår samtidig på jorden, og sjansen for at hvor mange ville slått sammen i en gruppe på ca 50 mennesker – kan du bidra?
Uh, hvor i all verden begynner man?

Problemet består altså av å beregne sannsynligheten for at to tilfeldige mennesker har hjerter som slår i takt. Det krever en del forutsetninger for hjerterytmer, og en diskusjon av hva samtidighet egentlig innebærer.

Et normalt hjerte har hjerterytme mellom 60 og 100 slag per minutt. Toppidrettsutøvere kan ha en rytme på så lavt som 40, men det er ekstremalavvik. Jeg velger derfor å ta basis i 60-100 intervallet og normalfordeler rundt 80 bpm (beats per minute). Det vil si omtrent 1.33 slag per sekund, eller 0.75s for hele durasjon av et slag, med sammentrekning og pumping til neste slag begynner.

Et problem vi må ta stilling til er at hjertet går gjennom mange forskjellige faser i løpet av et vanlig hjerteslag, og det er dermed veldig vanskelig å definere samtidighet og hva «i takt» egentlig betyr i denne sammenhengen. Er to hjerter «i takt» om de banker innenfor et sekund av hverandre? Er de i takt om det ene trekker seg sammen mens det andre ekspanderer? Hvor presise trenger vi egentlig å være her?


Med utgangspunkt i to personer med identisk puls, virker det naturlig å definere takt som en samtidig «start» på hjerteslaget. Vi kan altså snevre inn definisjonen til at «i takt» krever samtidighet i det elektriske signalet som igangsetter slaget, og at forskjellen mellom disse to må være et så marginalt avvik at vi sliter å skille mellom dem.


Det elektriske signalet som sparker hjertet igang kalles for QRS-komplekset, og antas normalt å vare mellom .06-0.1 sekunder (fra:Wikipedia). For å ha et enkelt tall å forholde oss til tar vi utgangspunkt i medianverdien på 0.08 sekunder.

Hittil har vi altså tatt utgangspunkt i 80 slag i minuttet, hvert med et varighet på 0.75s, og at det initielle kicket har en varighet på 0.08s.

Neste utfordring består av å definere hvor stort det marginale avviket mellom slagene må være for at vi skal klare å skille mellom dem. Her var jeg usikker på hvordan jeg skulle gå frem, så jeg valgte den opplagte løsningen: jeg satte opp to metronomer, og prøvde å finne ut når jeg kunne høre et tydelig avvik i rytme. Dette viste seg å ligge å omtrent \frac{2}{60}-dels forskjell, eller drøye 3% differanse. Ved bruk av metronom kan jeg høre tydelig rytmeforskjell først ved \frac{2}{60} -dels avvik i takt, det vil si avvik på omtrent 3% i rytmen.

Artig nok fant jeg også en artikkel som bekreftet dette resultatet etter klinisk eksperimentering. Centre for History and Analysis of Recorded Music (CHARM) har publisert en artikkel der de har undersøkt Just Noticable Differences (JND), altså hvor mye du kan variere tempo i musikk før lytterne klarer å høre et klart avvik. Som det fremgår av artikkelen:
… if you increase the tempo by 3% each beat, a person (at least the one who took the test) can perceive the acceleration in tempo. If the tempo is changed by 1% for each beat, then a tempo will not be perceptible until at least 5 beats (including the ones used to define the starting tempo).
                                                                                                  –Mazurka.org

Artikkelen bekrefter altså at et 3% avvik i tempo er et merkbart avvik. Vi benytter derfor dette som målet vårt for samtidighet i rytme. Et hjerteslag vurderes altså for anledningen å være «i takt» med et annet dersom det er startet før eller etter 3% av hjerteslagsimpulsen (QRS) til et annet hjerte, altså pluss/minus omtrent to og et halvt millisekund. Mitt og et annet hjerte er dermed tilnærmet lik i takt om det andre hjertet fyrer impuls 2.5 millisekund før eller etter mitt.

Vi har dermed et intervall på omtrent 5 millisekunder hvor to hjerter kan vurderes for å være i takt, ut av en total varighet på 0.75 sekund. Det er omtrent 0.66% av varigheten, eller \frac{1}{150}-del av den totale perioden. Det vil si at du statistisk kan forvente å finne noen med samme hjerterytme som deg selv en gang i en gruppe på 150, gitt forutsetningene vi har lagt til grunn. Dette er dog bare sannsynligheten for at noen deler rytme med deg. Hva er sannsynligheten for at to tilfeldige personer i et rom deler takt?

Dette problemet er i seg selv et artig problem, for det ligner mye på det såkalte bursdagsproblemet. I bursdagsproblemet forsøker man å finne hvor mange personer som må være i et rom for at det skal være 50% sjanse for at to deler samme bursdag. Det logiske og enkleste utgangspunktet er at det ved 366 personer i et rom må være 100% sjanse for at noen  deler bursdag, men interessant nok viser det seg at det kun kreves 23 personer for 50% sannsynlighet, og at det ved 70 personer er 99% sannsynlighet for at to personer deler bursdag.

Dette er fordi hver eneste nye person i rommet må sammenlignes opp mot alle som allerede er i rommet. Det holder ikke at den nye personen ikke deler bursdag med deg, vedkommende kan heller ikke dele bursdag med noen andre som er i rommet.

Løsningen tar altså utgangspunkt i at det er en like stor sjanse for at noen har bursdag på hver av årets dager (det finnes noen klyngedannelser for bursdager, men de regnes ikke som signifikante nok til å ha særlig effekt på resultatet).
Vi definerer at P(A) er sannsynligheten for at to personer deler bursdag, og at P(A') er sannsynligheten for at ingen to personer deler samme bursdag. Da fremgår det logisk nok at P(A) = 1 - P(A'). Vi kan altså like greit se på når sannsynligheten for at ingen to personer har samme bursdag dypper under 50%, ettersom at dette vil tilsvare at sannsynligheten for at to personer har samme bursdag overstiger 50%.


Den første personen har en \frac{365}{365}-dels sjanse for å ikke ha bursdag samme dag som noen andre, ettersom at det ikke er noen andre å dele med. Personen kan altså ha bursdag en hvilken som helst dag. Person 2 kan ha bursdag alle dager utenom den person 1 har, det vil si: \frac{364}{365}.

Sannsynligheten for de to personene ikke har samme bursdag er da \frac{365}{365}*\frac{364}{365} = 0.9972

Den tredje personen kan hverken dele bursdag med person 1 eller person 2, og kan dermed bare velge blant de 363 resterende dagene. Den kumulative sannsynligheten for at ingen deler bursdag faller altså til  \frac{365}{365}*\frac{365}{365}*\frac{363}{365} = 0.9918

Slik kan vi fortsette helt til vi kommer til den 23. personen. Da vil sannsynligheten for at ingen to personer deler bursdag være:
\frac{365}{365}*\frac{364}{365}*\frac{363}{365}*...*\frac{343}{365} = \frac{1}{365}^{23} * (365*364*363*...*343) \approx 0.4927


Vi kan benytte en helt identisk tilnærming når vi vurderer sannsynligheten for at to personer har samstemte hjerteslag. Med utgangspunkt i mulighetsintervallet på 5 millisekunder, eller \frac{1}{150}-del av tiden ved et vanlig hjerteslag, kan vi vurdere hvor mange personer som skal til før sannsynligheten for at to hjerter banker likt overstiger 50%.

Vi tar igjen utgangspunkt i at en person kan ha en hjerteimpuls som fyrer på et vilkårlig tidspunkt. Neste person i rommet vil da ha \frac{149}{150}-dels sjanse for at hjertet fyrer QRS-periode som ikke skal falle innenfor 2.5 millisekunder før eller etter den første personens impuls. Den tredje person har tilsvarende \frac{148}{150} i mulighetsrom. Den kumulative sannsynligheten for at det ikke er noen som deler impulsperiode innenfor det marginale avviket på 5 millisekunder er helt tilsvarende det vi hadde tidligere; \frac{150}{150}* \frac{149}{150}* \frac{148}{150} \approx 0.98.

Hvor mange personer må det være i rommet før det er en 50% sjanse for at to impulser faller innenfor samme 5 millisekunders intervall?
Svaret viser seg å være lavt, allerede ved 15 personer har vi krysset 50%-grensen:
\frac{150}{150}*\frac{149}{150}*...*\frac{136}{150} \approx = 0.4849
Det skal altså ikke mer enn 15 personer til i et rom før det er 50% sjanse for at to av hjertene slår i takt, gitt de forutsetningene vi har til grunn.

Den magiske 99%-grensa krysses ved 37 personer.
\frac{150}{150}*\frac{149}{150}*...*\frac{114}{150} \approx = 0.0078
Med 37 personer eller mer er det altså mer enn 99% sjanse for at minst to hjerter slår i takt.

Den kumulative sannsynlighetsfordelingen ser ut som følger:
kumulativ-synkronisering

Det må nevnes at dette, i likhet med de fleste postene på denne siden, er en forenkling av virkeligheten. Vi har her tatt utgangspunktet i en felles, fast puls på 80 bpm, men dette er jo langt fra noen selvfølgelighet. I den virkelige verden vil vi forvente å møte personer med rytme fra 60 til 120 slag per minutt, og følgelig vil tilfellene hvor slagene er i takt være langt sjeldnere. Ikke bare kan vi forvente et stort spenn, men fordelingen av disse rytmene vil også være en kontinuerlig, ikke diskré, fordeling. Vi kan altså forvente å finne individer med puls på 74.67 bpm, 74.68 bpm, 74.69 bpm, osv.

Samtidig vil man også kunne finne tilfeller der to personer slår i i takt, men ikke nødvendigvis har samme hjerterytme. Hvis en person har en puls på 60, og en annen 120 vil annenhvert slag kunne slå samtidig, noe som må vurderes for å være i takt. En person med puls på 100 og en med puls på 60 vil også kunne vente å oppleve at enkelte slag er synkroniserte, selvom den helhetlige takten uteblir.

Om ikke noe annet må det kunne sies å være et poetisk element i nettopp det, for selv om du med over 7 milliarder andre mennesker er garantert at noen har et hjerte som slår i takt med ditt, vil det være langt vanligere at du møter personer hvor enkelte slag støtt og stadig er synkroniserte. Som alt i alt er en ganske god oppsummering av det hele.

Idéen om sjelevenner, to personer hvis hjerter banker som ett, er altså ikke en matematisk umulighet – bare en sjeldenhet forutsatt en homogen puls. Kanskje ikke like romantisk, men hey – det er noe?
Reklamer

Studentenes timelønn

Et problem jeg støter på overraskende ofte når jeg sitter og doodler meg gjennom disse innleggene er verdiskapningen knyttet til studenter. Jeg er en student, og dermed er det ofte naturlig at jeg benytter megselv som eksempel i innleggene. Men når man regner verdiskapning som tapt eller vunnet verdi av en gitt timelønn sliter jeg plutselig litt. For på snitt går det greit, på snitt går alt greit, men helt realistisk:

Jeg har ingen timelønn.

Det er ikke helt sant. Jeg har en deltidsjobb som jeg faller innom på uregelmessig basis, men i det store og det hele, iløpet av studiehverdagen min, har jeg ingen timelønn.

Eller har jeg det?

Hvis vi ser på et problem der vi vurderer hvor mye penger jeg kan bruke, et konsum- eller budsjettsproblem, går det ganske greit. Jeg lever jo på et studielån. Jeg mottar omtrent 100.000 i året, og det er dermed mulig for meg å regne dette som en lønn fordelt utover hver måned. Dermed kan jeg vite hvor mye jeg kan bruke. Men skal vi regne på sikt er jo -ikke dette en lønn, det er et lån som skal tilbakebetales.

Jeg har dermed lyst til å forsøke å beregne en gjennomsnittlig timeslønn for en (gjennomsnittlig) student. Tanken min er som følger; en person som ikke tar høyere utdannelse kan antas å ha 13 års skolegang, ut VGS, før de hopper rett i arbeid som 19-åring. En person med en bachelor- eller mastergrad vil (forhåpentligvis) hoppe ut i arbeidslivet som 22/24-åring. Det er ingen hemmelighet at personer med høyere utdanning ofte mottar høyere lønn. Et aktuelt spørsmål er dermed hvor mye mer studentene tjener som følge av utdanningen.

Dette skal være ganske simpelt egentlig – Norge har god lønnsstatistikk, så det vi trenger å gjøre er å finne den gjennomsnittlige lønnen for en som har fullført høyere utdanning, og sammenligne den med den gjennomsnittlige lønnen for en som har hoppet rett ut i arbeidslivet.

Det første vi gjør er enkelt og greit; vi finner lønnsstatistikk for ulike utdanningsnivå hos SSB:

Gjennomsnittlig månedslønn etter utdanningsnivå

Kilde: SSB.no

Vi ser at for personer som har fullført kun grunnskole ligger snittlønnen per måned på 33.700, eller en årslønn på 370.000 (11 månedslønner), før feriepenger o.l. Fullfører man VGS øker årslønnen på snitt til 452.000, rett under landssnittet på omtrent 470.000. Ett til fire år med universitets- og høyskoleutdanning øker lønnen til 521.400, og med mer en fire år høyere utdanning er man på 652.300.

Så begynner moroa. Vi kan nemlig ikke bare se på differansen mellom disse helt uten videre. Vi har jo allerede konkludert med at en som går rett ut i arbeidslivet i en alder av 19 vil kunne jobbe lenger enn en som bruker 3-5 år på en bachelor- eller mastergrad.

Noen antagelser

Vi ser vekk fra feriepenger o.l, og vi antar at lønna er konstant gjennom hele arbeidslivet. Det vil si at man starter med full gjennomsnittslønn, men man får aldri noen lønnsheving iløpet av karrieren.  Vi antar også at alle jobber fra de er ferdig med studiet, og t.o.m fylte 67. år.  Videre ser vi vekk fra rente. Dette er en stor forenkling, men vi begrunner den simpelt – vi antar at alle bruker alt de tjener av penger hvert år – og dermed ikke sparer opp noe over tid som det kan rentes på. Dermed er det også greit å ikke anta noen forskjell i inntekt over tid, siden det vil være snittet som teller, og ikke fordelingen (da det ikke er noen renteeffekter å hente ut uansett.) Vi antar at en bachelorgrad er standardisert til 3 år med studier, og en mastergrad standardisert til 5 år – og at studiene fullføres på normert tid.

For en som går rett ut i jobb etter VGS har vi altså 48 år i arbeid (19-67), med en snittlønn på 452.000; en livstidsinntekt på 21.696.000, eller drøye 22 millioner kroner. Med en bachelorgrad kan man forvente 45 år i arbeid, og en mastergrad 43 år, med livstidsinntekter på henholdsvis 23.463.000 og 28.048.900.

Vi ser altså at bachelorstudenter tjener 1.767.000 mer enn en som hopper rett ut i arbeid etter VGS, mens masterstudenten sitter igjen med 6.352.900 mer.

En artig digresjon:

livstidsinntekt

Vi ser at masterstudenten tar igjen VGS i det 17. året, dvs. etter 12 år i arbeidslivet, mens bachelorstudenten ikke gjør dette før det 23. året – 20 år etter endt utdanning. Frem til man er 36 er det altså like godt å ha droppet høyere utdanning, og dette gjelder frem til alder av 42 sammenlignet med bachelorstudenten. Etter det derimot blir forskjellene stadig større.

Definisjonen på en fulltidsstudent er en som tar 30 studiepoeng iløpet av et semester, men dette sier ingenting om antall arbeidstimer som må legges ned – noen jobber mer enn andre. Vi kan dermed ta et (muligens noe urealistisk) utgangspunkt i at en fulltidsstudent lever opp til arbeidsmengden til en heltidsansatt, med 1750 arbeidstimer i året. Isåfall består en bachelorgrad av 5250 studietimer, og en mastergrad av 8750. Om vi dermed tar merverdien av hvert av studiene på livstidsinntekt, og deler det på antall arbeidstimer får vi en gjennomsnittlig timelønn på 336.50,- for en bachelorstudent, og 726,- for en masterstudent. Dette er interessant – den implisitte timeslønnen for en student er betydelig høyere enn den faktiske timeslønnen etter et endt studie: 297,- for en med 3 år studier,  og 372,- for 5 år.

Dette reflekterer vel bare at kunnskap er verdifullt. 

Det må sies at i statistikken skilles det ikke mellom hva slags bachelor- eller mastergrad man innehar. Noen studier vil resultere i en høyere lønn, andre i lavere. Det skilles heller ikke mellom snittkarakterer, A-studenter kan rimlig antas å oppnå en høyere lønn enn D-studenter. Dette er dermed snittverdien for snittstudenten.

Hva så med studielån? Jeg nevnte tidligere i innlegget at dette ikke kan ansees for inntekt. Det må da påvirke tallene?

Ikke egentlig. Om vi, tro til forutsetningene, ignorer rente vil lånet per definisjon ikke har noen langsiktig effekt. Lånet på 300.000-500.000 betales tilbake i sin helhet, men har ingen ytterligere effekt – det er dermed kun en intertemporær forflytning av inntekt hvor staten tilbyr penger i en periode der timeslønnen kun er implisitt, og ikke eksplisitt. Selvom man inkluderer rente er rentenivået såpass lavt, og studielån såpass gunstig, at det har liten reell effekt. Ønsker man absolutt å inkludere det kan man eventuelt flytte kurvene marginalt ned i de første 20 årene, tilsvarende lik betalingene på lånet – eller så kan vi se for oss man ‘ikke mottar lønn’ det første året i jobb – men at alt av lønn heller går til nedbetaling av lånet. Forskjellen er liten sett i det lange løp.

Hva skal man så gjøre med de ekstra pengene man får ut av et studie?

For bachelorstudenten kan det nevnes at det tilsvarer at man sitter med omtrent 1613,- om dagen, om man sprer det perfekt utover året – og masterstudenten 3481,-

Det tilsvarer henholdsvis 250 og 535 pakker nudler om dagen om man kjøper dem til 6.50 på Rema. Alternativt åpner det for nærmere 62 halvlitere på Samfundet per dag for masterstudenten. Velger man det alternativet kan det dog bare holde på i omtrent 450 dager før resten av pengene må settes av til levertransplantasjonen. (Hentet herifra)

PS: Litt om å vente.

Hvor sent kan man vente

Denne frustrerte meg litt. Det koker jo ned til hvor lenge det kreves at du jobber med lønnen du oppnår etter endt studie, når du tar hensyn til at de årene det tok å studere alternativt kunne blitt benyttet til lønnet arbeid. Men du må også tenke på lønnen du taper de årene du jobber for å ta igjen lønna du tapte.

Altså: 3-årig bachelor kunne alternativt blitt benyttet til å håve inn 452.000 i året, noe som summerer til 1.356.000. Dermed kreves det 2.6 år med bachelor-lønn for å dekke den tapte kostnaden ved studie. Men de 2.6 årene kunne igjen blitt benyttet til å tjene penger som ikke skulle dekke inn et tap. Det tilsvarer dermed ytterligere 2.25 år med bachelor-lønn for å hente inn. Som igjen krever ytterligere 1.95 år med arbeid. Og slik fortsetter det…

Argumentet kan forenkles; hvert år med bachelorlønn har en merverdi på 521.400 – 452.000 = 69.400. Ergo krever den totale summen 1.356.000/69.400 = 19.5 år med arbeidsliv.

Limer vi disse verdiene inn i i Excel-arket fra tidligere får vi altså 25 år med arbeid (19 til 44), før det er 3 år med ingen inntekt. Her studerer man (44-46), før man igjen begynner i jobb med høyere lønn i 20 år (47-67). Da rekker man akkurat å ta igjen den samme inntekten som en VGS-elev oppnår.

For at det skal lønne seg må man altså begynne som 44-åring.

studier som 44

 

For mastergrad blir det tilsvarende fem år som kunne blitt benyttet til å tjene 2.260 mill. Merverdien av mastergradslønnen er 200.300 per år, og man trenger altså 11.28 ~ 12 år i arbeidslivet.

Altså må studiestart være som 51-åring

student som 51

PPS: Litt om renter.

Jeg fikk et spørsmål om i hvilken grad renteeffekter vil slå ut på resultatet. Renteeffekter vil redusere forskjellen mellom VGS, Bachelor og Master, da personen som blir først ferdig vil oppnå flere år med forrentning. Det er likevel en såpass stor forskjell mellom bachelor- og master-inntekt at denne alltid vil lønne seg.

3% rente

Grafen over viser utviklingen i inntekt ved 3% forrentning per år. Vi ser at tendensene fra tidligere opprettholdes, men at differansene reduseres. I dette scenarioet sitter bachelorstudenten kun igjen med 2.4% mer enn VGS-eleven, ned fra 8.1%.

Det finnes dermed et rentenivå hvilket gir at VGS studenten tjener opp et så stort forsprang iløpet av de tre første årene, at bachelorstudenten akkurat klarer å ta igjen vedkommende ved et fullt arbeidsliv. Dette viser seg å være 4.18%

4.18% rente

Tilsvarende finnes det et rentenivå hvilket gir at VGS-studenten tjener opp nok iløpet av de fem første årene til å at masterstudenten akkurat klarer å ta igjen iløpet av et fullt arbeidsliv. Dette viser seg å være 7.3%

7.3% rente.png

For alle rentenivå over 7.3% vil det dermed lønne seg å droppe utdanning, og komme fortest mulig igang, da renteeffektene så dominerer inntektseffektene.

Vi er ganske langt unna den situasjonen i Norge idag:

rente sparing

Hvit løgn, sort løgn og statistikk

krf går mest frem måling abcnyheter  tv2

Så, Opinion har kommet med en ny meningsmåling på oppdrag av Avisenes Nyhetsbyrå (ANB), og de store nyhetene er at KRF raser avgårde med 1.9% økning mens MDG faller med 1.6%, og ligger dermed under sperregrensa.

Problemet er bare at…

tallenes tale

… tallene baserer seg på 962 telefonintervjuer, hvorav bare 74% har avgitt svar. Det vil si at de har 712 person som har fortalt hvor de står.

I 2015 var det såvidt over 4 millioner stemmeberettigede personer i Norge (4.016.624 ifølge SSB). Det vil si at Opinion har forhørt seg med 0.01% av befolking.

Nå er det greit nok å ikke forhøre seg med hele befolkningen, det kan vi heller ikke forvente. Meningsmålinger fungerer nettopp ved at man finner et representativt utvalg av den totale populasjonen og estimerer de faktiske andelene basert på dette. Dersom man trekker helt tilfeldig fra populasjonen vil fordelingen av utvalget etterhvert gå mot den faktiske fordelingen etterhvert som man har flere og flere observasjoner.

Det som er kritisk å ha i bakhodet da er at desto flere observasjoner man har desto nøyaktigere vil estimatet bli, og motsatt. Så når man har et lite utvalg vil usikkerheten i estimatene bli forholdsvis stor. Dette er det vi kjenner som feilmarginen.

Feilmarginen vil variere avhengig av partistørrelse. Dersom partiet er lite, og vi har få observasjoner, vil det naturligvis være en større feilmargin enn dersom partiet er større og vi har like mange observasjoner.

Opinion oppgir sin feilmargin som «mellom 1 og 3 prosent avhengig av partistørrelse.»

Hvis vi ser på tallene igjen, relativt til partistørrelsen, finner vi som følger.

KRF er et relativt lite parti, og har ligget på rundt 5%. Med en feilmargin på 1-3% kan vi dermed ikke vurdere en endring på 1.9% som statistisk signifikant. For alt vi vet står de dønn stille på meningsmålingene. 

MDG er et enda mindre parti. Dermed sier det seg selv at 1.6% endring heller ikke er signifikant. 

Hva med de andre partiene?

Foruten om Høyre ligger alle andre parti på under 1% endring. Det er mindre enn selv den best estimerte feilmarginen på 1%. Høyre har en nedgang på 1.3%, men selv her kan vi i beste fall (sånn rent statistisk sett, ikke nødvendigvis politisk) peke på en nedgang på 0.3%.

Det betyr at avisartikkelene like greit kan være:

kanskjekrf måling abcnyheter ny

tv2ny

There are three kinds of lies: lies, damned lies, and statistics,

-Benjamin Disraeli

Kom igjen ‘a.

The New York City Police Officer Problem

Som et ledd i juleferien min befant jeg meg for et par dager siden på Newark flyplass. En av de første tingene som slo meg i det jeg vandret gjennom terminalen var den enorme mengden med politi tilstede. Det er uvant å se politi vandre rundt i så stort antall i Norge.

En artig detalj med amerikanske politimenn er at de alle går rundt med hvert sitt skilt med deres personlige nummer, såkalt «Badge Number». Dette nummeret er individuelt for hver konstabel, og kan brukes for å identifisere konstabelen i etterkant, dersom man f.eks har en klage. De fleste av oss kjenner til disse fra filmer eller tv-serier – skiltene er sølvfargede, støpt av metall og ser sånn ca. sånn her ut …

NYPD badge

… med små variasjoner i design avhengig av hvilken gren av politiet man er del av, og hvilken rang man har.

Politiet på flyplassterminalen var New York-politi, med logo og bilde av byen stolt vist frem på uniformen. Dette fikk meg til å lure; om New York-politiet også dekker flyplassene i New York, som tross alt ligger i nabostaten New Jersey, trenger de mange konstabler. Hvor mange politimenn finnes det egentlig i New York-politiet? Kan vi estimere det basert på skiltnummerne vi observerer?

Iløpet av gåturen min fikk jeg notert meg skiltnummeret til to konstabler som sto og drakk kaffe; henholdsvis 34440 og 45234. Hva sier dette oss om antallet politikonstabler?  Først og fremst, at det finnes minst to.

Videre kan vi anta at det finnes minst 10.000, differansen mellom det høyeste og laveste tallet vi har observert. Hvorfor ikke bare anta minst 45.000, spør du? Fordi vi har ingen anelse om hvorvidt alle nummerne er i bruk, det kan være at det finnes 30.000 pensjonerte politikonstabler med hvert sitt skilt.

Begynner vi å betvile systematiseringen av nummerne på denne måten er vi plutselig på dypt vann. Vi vet faktisk ikke en rekke ting; hvorvidt alle nummerne er i bruk, hvorvidt nummerne fordeles i strengt stigende rekkefølge (hva om de er tilfeldige?) eller hvorvidt nummerne i seg selv inneholder et internt system, f.eks at alle nummere som starter med 30 hører til på Manhattan.

Denne siste vurderingen virker usannsynlig – da ville vi ikke forventet å finne to konstabler med ulike startsiffere på samme flyplass. Siden ingen av sifferne på de to konstablene stemmer overens er det dermed lite som tyder på internt system i nummereringen på basis av geografisk plassering. Det er hvertfall en start.

Vi har dermed to holdepunkt:

  1. Vi vet at alle nummerne er unike til en politikonstabel. Hvis ikke hadde poenget med nummereringen forsvunnet.
  2. Vi har observert to konstabler med nummer 34440 og 45234.

For å komme videre gjør vi noen grunnleggende antagelser.

  1. Vi antar at nummerne ikke er tilfeldig fordelt, men heller deles ut sekvensielt. Det vil si at hver ny konstabel mottar et nummer høyere enn forrigemann.
  2. Vi antar at konstabler som trer ut av styrken må levere inn skiltet sitt (som ofte dramatisert på tv), og at dette resirkuleres. Skiltnummerne vil dermed tilsvare mengden aktive politikonstabler i styrken.
  3. Vi antar at nummerne ikke inneholder noen form for internt system (geografiske restriksjoner, sjekksummer eller lignende) som vil stride med den tilsynelatende tilfeldige, sekvensielle fordelingen av skiltnummer på tvers av byen ellers. Dette er strengt tatt ikke en nødvendig forutsetning – men den skader ikke for å sikre oss.

Med disse restriksjonene på plass kan vi nå begynne å estimere hvor mange politimenn det er. Vi har altså observert 34440 og 45234. Med antagelsene gitt over kan vi nå estimere at det må være omtrent 80.000 politimenn i New York. Hvordan da?

Vi ser på den totale mengden med politimenn i New York som en samlet populasjon vi trekker tilfeldige utvalg fra (eller tilfeldig observerer med kaffekoppen i hånd). Siden nummerne er sekvensielle fra 1 til maksimalt skiltnummer kan vi dermed vite at snittet av populasjonen vil være lik medianen, og representere den midterste politimannen i styrken. Antall politimenn i New York vil dermed tilsvare to ganger snittverdien av et utvalg som tilnærmer seg uendelig, eller i dette tilfellet, et utvalg som tilnærmer seg den samlede populasjonen vi trekker utvalgene fra. Vi kan dermed estimere (34440+45234) = 79.764 politimenn.

Problemet med dette er selvfølgelig at vi har et forferdelig lite utvalg. Det kan dermed hende at det kun eksisterer 45.500 politimenn, men at vi var uheldige nok til å trekke to tall høyt over snittet. Eller det kan tenkes at det eksisterer 120.000 politimenn, og at observasjonene våre uheldigvis ligger under det reelle snittet. Den eneste måten vi kan forbedre estimasjonen vår er ved å utvide antall observasjoner.

Jeg jaktet videre på politimenn fra New York-styrken, men sine egne skiltnummer. På turen min oppfaget jeg raskt at det også fantes en annen lokal politistyrke, Port Authority, som hadde betydelig lavere skiltnummer på rundt 1000-2000. Disse valgte jeg å ignorere, det var New York-politiet jeg ville finne ut av.

I den ene bokhandelen, med dagens avis i hånden oppdaget jeg en ny konstabel – #15782. Snittet mitt var dermed redusert til omtrent 32.000. På vei tilbake forbi de første to konstablene oppdaget jeg nå en ny, tredje konstabel – #20743; nytt snitt: 29.000

Så, i det vi vandret til gaten for å boarde flyet, fikk jeg øye på min siste politikonstabel, #8372, og med det var mitt endelige snitt 24.932, og det påfølgende estimatet for antall politikonstabler i New York; omtrent 50.000 stk.

Så, hvordan sammenligner dette med det virkelige antallet? Jeg ville anta at estimatat mitt er litt høyt; jeg er vant til å tenke at det er omtrentlig 2 politimenn per 1000 innbyggere – som er gjennomsnittet for Norge. Estimatet jeg her har kommet frem til estimerer nesten tredobbelt av det, med 5.8 politimenn per 1000 New Yorkere. Det er kjent at New York har usedvanlig mange politimenn iforhold til innbyggere, men tredobbelt av vanlig størrelse virker i overkant mye. Jeg ville heller estimert omtrent halvannen gang så mye, altså 3-3.5 per 1000.

Ifølge NYPD selv har de omtrent 40.000 politimenn, som tilsvarer 4.7 politimenn per 1000. Med utgangspunkt i kun 5 observasjoner jeg ganske fornøyd med estimatet på 50.000 – det ligger forholdsvis nærme. Hadde jeg kun gjettet, basert på 3 per 1000-antagelsen, ville tilsvart en estimert politistyrke på 25.500, halvannen gang så feilaktig som utvalgsestimatet mitt.

Denne typen problemstilling er forholdsvis kjent innenfor statistikk, og går under navnet «The German Tank Problem». Under andre verdenskrig ønsket de allierte styrkene å estimere antall tanks tyskerne hadde tilgjengelig – for å kunne bedømme hva slags motstand de kunne forvente seg. Hvordan kunne man best mulig gjøre dette? Løsningen var ganske enkel – de tyske produsentene av tanks hadde, i ekte tysk ingeniørånd, merket alle delene av stridsvognene de bygget med serienummer, fordelt sekvensielt etterhvert som nye tanks ble produsert. Det betød at hver gang de allierte styrkene fanget eller ødela en tysk tanks kunne de notere seg serienummerne, regne snittet på ny, og estimere en ny størrelse på det totale antallet tanks. Etterhvert som flere og flere tanks ble tatt ut av spill ble estimatet mer og mer presist. Resultatet for produksjonen av amerikanske stridsvogner var også ganske umiddelbar – alle serienummer i amerikanske tanks ble randomiserte. Slik kunne man forhindre at tyskerne vendte statistikken tilbake mot dem.

 

Biologiske fallgruver – eller hvorfor mange hater statistikk

Statistikk er ikke et enkelt fagfelt. Det er lett å se systemer og sammenhenger som ikke nødvendigvis er der, og det kan være vanskelig å finne de sammenhengene man skulle ønske lå til grunn. Utallige antall studenter har gjennom tidene sittet og forbannet statistikkfaget for at det er så lite samarbeidsvillig. Men hva er det som gjør statistikk såpass vanskelig?

En del av svaret ser ut til å være så grunnleggende som menneskelig biologi.

Men før jeg legger ut om dette vil jeg gjerne snakke litt direkte til deg.

Ja, deg ja.

Jeg har nemlig gjort litt research på hvem leserne mine er, og tror jeg har ganske god oversikt. Jeg skal dermed forsøke å beskrive nettopp deg, kjære leser, med et kort lite avsnitt. Jeg beklager hvis dette blir litt personlig.

Du har et stort behov for at mennesker skal like og beundre deg. Du har en tendens til å være selvkritisk. Du har en stor porsjon ledig kapasitet som du ennå ikke har dratt fordel av. Selv om  du har enkelte svakheter i din personlighet, har du i all vesentlighet evnen til å kompensere for disse. Utenpå er du disiplinert og underlagt stor selvkontroll, men innvendig bekymrer du deg i større grad, og er usikker. Du tviler iblant sterkt på om du har tatt de riktige beslutningene, og gjort det som er riktig. Du foretrekker en viss grad av variasjon, og blir lite tilfreds når du blir hemmet av begrensninger og bestemmelser. Du vurderer deg selv som en selvstendig tenker og godtar ikke andres uttalelser uten tilfredsstillende bevis. Du har funnet ut at det ikke er lurt å være for direkte i utleveringen av seg selv i omgang med andre. Til tider er du utadvendt, omgjengelig og sosial, mens du andre ganger er innadvendt, skeptisk og reservert. Enkelte av dine ønsker kan være ganske urealistiske. Sikkerhet er et av dine store mål i livet.

Forvirra? Jeg kommer tilbake til dette om litt.


System 1 og 2

Økonomen Daniel Kahneman fikk i 2002 nobelprisen i økonomi (eller Sveriges Riksbanks pris i økonomisk vitenskap til minne om Alfred Nobel, for kverulantene der ute) for arbeidet sitt innenfor beslutningsteori – hvordan mennesker tar de valgene de gjør. Han ga i 2011 ut den bestselgende boken Tenke, fort og langsomt, hvor han presenterte en del av tankene sine,  og hvor han deler menneskelig bevissthet i to deler, system 1 og 2.

System 1 er automatisk, raskt og uanstrengt – vi er som regel ikke klar over at vi bruker det. Det er dette vi omtaler som intuisjon eller instinkt. Det er sterkt påvirket av humør og emosjonell tilstand, og benytter seg av snarveier og sammenhenger for å jobbe kjapt og effektivt. Fordi det er såpass raskt og emosjonellt kan det ofte medføre alvorlige feil i resonnementet vårt. «Fort og gæli'» er en god beskrivelse.

System 2 er det kognitive tankesystemet – bevisst tankegang. Det er dette vi benytter i klasserommet, når vi jobber bevisst med oppgaver. Det er tungt og resonnert, tregt og logisk, progressivt og selvbevist. Det gjør færre feil enn det instinktive systemet, og siden vi vet hvordan vi har nådd en konklusjon kan vi jobbe oss bakover i beslutningsprosessen og rette egne feil.

Mange av feilene som oppstår ved behandling av tall og statistikk kommer av at vi benytter system 1 istedet for 2. Dette skjer nettopp fordi et av kjennetegnene ved system 1 er at vi ikke vet vi benytter det. Vi når et svar og en konklusjon uten å vite hvordan vi fant den.

Det er en veldig god grunn til dette. Hadde det ikke vært for vår utbredte bruk av system 1 hadde antageligvis få av oss vært her idag. Dersom forfedrene våre hadde stoppet og vurdert hvorvidt sabeltanntigeren var en trussel, istedet for å løpe, hadde vi ikke eksistert. System 1 er  designet for rask vurdering av omgivelsene våre, og hurtig respons. Det er det som får oss til å løpe når vi oppdager at vi er i trøbbel. Så når man i matematikk eller logiske problemer trekker en rask og feilaktig konklusjon er det fordi system 1 ønsker å gi oss en hurtig løsning, for å hjelpe oss ut av problemet. Som ironisk nok ofte bare leder til mer problemer.

Dessverre sliter vi med å bruke system 2 like aktivt som vi gjerne skulle, uten å behøve en ferie etterpå. Det er tungt å skulle bevisst resonnere seg frem. Det er slitsomt. Det hender også at vi tar intuisjonen vår for god fisk, at vi rett og slett glemmer kritisk gransking. Konsekvensen av dette er at vi i stor grad lener oss på system 1 – og dermed begår en rekke åpenbare feil i resonnementene våre.  Jeg har lyst til å skrive litt om to konkrete feil, bekreftelsestendens og narrativ feilslutning, som er spesielt utbredte.

Bekreftelsestendens

Bekreftelsestendens (på engelsk: confirmation bias) omhandler at vi har en tendens til å søke informasjon som bekrefter tankene våre. Dette kan  medføre at vi velger å utelate informasjon som strider med det vi tror stemmer, og dermed styrke en ubegrunnet antagelse. En person som er for strengere våpenkontroll vil søke etter nyheter og personer som støtter sitt eget synspunkt. Etter en skyteepisode vil personen velge å tolke informasjonen om hendelsen på en måte som støtter opp under tankene om at strengere våpenkontroll er viktig. F.eks

«Hadde vi hatt strengere våpenkontroll ville færre personer fått tak i våpen, og det ville blitt færre skyteepisoder.»

En person som er mot våpenkontroll vil derimot oppleve akkurat samme effekten, men i motsatt retning. Personen vil oppsøke nyheter og personer som favoriserer sitt eget synspunkt. Etter samme skyteepisode vil samme personen tolke informasjon i et lys som favoriserer mildere våpenkontroll. F.eks

«Hadde vi hatt mildere våpenkontroll hadde flere personer kunne beskyttet seg selv effektivt, og det vill blitt færre skyteepisoder.»

«Men Martin,» tenker du kanskje, «dette er jo ikke feilaktig – det er jo bare forskjellige meninger?» Jo, det er i for seg sant. Problematikken ligger dog i at de to personene har blitt utsatt for den samme informasjonen, men likevel klart å trekke to vidt forskjellige konklusjoner, ved å velge ut de bitene av informasjonen som best stemmer overens med egne teorier.

Det finnes bedre eksempler; en arbeidsgiver som har fått godt inntrykk av en jobbsøker vil ubevisst lete etter positive elementer i cv’en som støtter inntrykket av at søkeren er en god kandidat. En forelsket person vil lett kunne se de gode sidene hos kjæresten sin, og ubevisst undertrykke de negative sidene. Bekreftelsestendens er også en av journalistens verste fiender. Ved å publisere korrekte fakta, men uten å publisere alle relevante fakta, kan journalister lett gi et misvisende bilde av en situasjon eller nyhet. Det er ikke nødvendigvis slik at journalisten aktivt velger å favorisere en side i en sak, men inntrykket vris for det.

«Personen i bilen hadde drukket en flaske vodka en time før ulykken.»

«Personen i bilen hadde drukket en flaske vodka en time før ulykken på parkeringsplassen der han hadde parkert.»

Det er opplagt at utelatelse av informasjon kan sterkt endre oppfattelsen av situasjonen.

Bekreftelsestendens ser ut til å kunne forklare et par interessante fenomener, blant annet horoskop og ekstrasensorisk persepsjon (ESP). Ta for eksempel beskrivelsen jeg ga av deg, helt i starten av innlegget. Hvordan syntes du den traff? Du er antageligvis skeptisk til å begynne med når du leser det – jeg har jo ingen mulighet til å vite akkurat hvem du er, eller hvordan du er – men sannsynligheten er ganske høy for at du kjente deg igjen i store deler av beskrivelsen. Dette er den såkalte Forer-effekten, som forklarer hvordan personlige horoskop kan oppfattes som spesielt treffende. Poenget er at teksten er skrevet spesielt vagt og generelt; hvem har vel ikke opplevd at de fremstår som mer selvsikre enn de egentlig føler seg? Bekreftelsestendsen slår til igjen!

ESP fungerer tilsvarende. Jeg har en venn som hevder han alltid vet når faren holder på å ringe – han tenker på faren sin – også ringer han! Hvor magisk er ikke det? Dessverre, veldig lite magisk. Bekreftelsestendensen gjør at vi husker de tilfellene hvor vi har opplevd dette – tenkt på pappa rett før han ringer. Men hva med alle gangen man har tenkt på far, og telefonen ikke har ringt? Eller de gangene far har ringt, og man ikke har tenkt på han? Vi har en evne til å sile ut de tilfellene som best passer overens med konklusjonen vår.

Fysikeren Richard Feynman er (blant veldig mye annet) kjent for å ha latterliggjort denne typen posteriori konklusjon,

«You know, the most amazing thing happened to me tonight… I saw a car with the license plate ARW 357. Can you imagine? Of all the millions of license plates in the state, what was the chance that I would see that particular one tonight? Amazing!»

Bekreftelsestendens er en logisk feilslutning. Den gjør oss sårbare fordi det undergraver beslutningsgrunnlaget vårt. Bekreftelsestendens kan enkelt lede til det Nassim Taleb i The Black Swan henviser til som «The Round-trip Fallacy», hvor utelatelse av avkreftelse leder oss til å tro at vi har en bekreftelse, med alvorlige logiske feil. I enkle eksempler kan det være lett å se feilen, men i mer komplekse situasjoner blir det langt verre.

Se for deg at jeg ligger utstrakt på togskinnene mellom Oslo og Trondheim i 5 timer en søndag ettermiddag. Etter fem timer reiser jeg meg og sier, «Se! Jeg ble ikke overkjørt, ergo er det ufarlig å ligge på togskinner». Dette er åpenbart en feilaktig slutning. Bare fordi jeg ikke ble overkjørt i mitt spesifikke utvalg (fem timer på en søndag) kan jeg ikke slutte at togskinner i sin helhet er ufarlige. Det vil faktisk være umulig for meg å bekrefte denne slutningen på denne måten. Dette går tilbake til den vitenskapelige metode – vi kan ikke med sikkerhet bevise at togskinner alltid er ufarlige. Vi kan hypotisere det. Vi kan etter tre dager på togskinnene uten å bli overkjørt anta at det er trygt. Det er først når toget treffer oss en uke senere at vi med sikkerhet kan si at togskinner ikke er trygge å ligge på. Men på dette tidspunktet er det kanskje ikke så relevant lenger.

Poenget er at vi ikke kan bekrefte noe ved å utvide samplet, men vi kan avkrefte ved kun en observasjon. Det kalles ofte negativ empiri.

Om jeg følger en mann på åpen gate i Oslo kan jeg ikke slutte «jeg har ikke sett mannen drepe noen – ergo er han ikke en morder». Jeg kan følge vedkommende i to måneder uten å se han myrde noen, og det vil fremdeles ikke være nok til å si med fullstendig sikkerhet at han ikke er en morder. Det er først når han brutalt knivstikker og dreper meg dagen etter at jeg med sikkerhet kan si at han er en morder (dog en veldig tålmodig en), siden jeg har avkreftet at han ikke er en morder.

Dette kan fort bli vanskeligere i mer kompliserte situasjoner. Ta en titt på de to følgende setningene.

Det foreligger ikke bevis for at dette er en finanskrise. 

Det foreligger bevis for at dette ikke er en finanskrise. 

Setningene er veldig lette å blande, og slutningen vi foretar kan lett blandes. Likevel er de veldig forskjellige.

Hva med de følgende setningene?

Det er ingen bevis på kreft i kroppen.

Det er bevis på ingen kreft i kroppen. 

Det er usannsynlig, dyrt og tidskrevende å sjekke hver celle i kroppen for kreft. Man er dermed nødt til å ta et utvalg, og undersøke dette for kreft. Det er her de to setningene er veldig, veldig forskjellige. Den første setningen sier at det ikke er blitt oppdaget noen kreft, men man har ikke utelukket at det kan være det for det. Den andre sier med fullstendig sikkerhet at det ikke er kreft i kroppen. Setning nummer to tilsier at hver eneste celle er blitt bekreftet fri for kreft.

Ved rask intuisjon er det veldig lett å blande disse to, men dette kan medføre alvorlige logiske brist. Et siste eksempel:

De fleste terrorister er muslimer

De fleste muslimer er terrorister. 

Her burde det være opplagt at setningene betyr to veldig forskjellige ting, og konsekvensen av å blande de to er enorm. Hvis vi antar at den første setningen er sann, at 99% av terrorister er muslimer, betyr dette at omtrent 0.001% av muslimer er terrorister, siden det finnes godt over 1 milliard muslimer i verden, og la oss anta 10.000 terrorister – 1 i 100.000. Så den logiske feilen å blande disse to utsagnene får deg til å overestimere sannsynligheten for at en tilfeldig utvalgt muslim er terrorist med en faktor på nesten 50.000!  Konsekvensen av å blande to ord kan bli at hele folkegrupper, etniske minoriteter og religioner utsettes for diskriminering og stereotyper basert på et helt minimalistisk grunnlag.

For ordens skyld, det blir som å si, «Jeg møtte en nordmann en gang som var drittsekk, så alle nordmenn må være drittsekker.» 

Rent logisk er disse eksemplene forskjellen på implikasjon og ekvivalens; alle A er B, men alle B er ikke A. Om en franskmann er pyroman kan vi ikke anta at alle franskmenn ønsker å brenne ned alt. Det burde være opplagt at det er en feilaktig slutning, men system 1 hopper inn for å redde oss – og lurer oss inn i en falsk sikkerhet.

Narrativ Feilslutning

Mennesker liker historier, vi liker sammenhenger. Hjernene våre jobber konstant for å finne sammenhenger mellom ting for å forenkle verden rundt oss. Hvis jeg ber deg huske nummerrekken «123456789» burde ikke det være noe problem. Det er jo bare hvert tall,  i stigende rekkefølge. Enkelt. Ber jeg deg derimot om å huske «926173845» vil de aller fleste slite betydelig mer. Det er like mange tall, så det burde være tilsvarende like enkelt – men mangelen på en sammenheng og et system gjør at vi sliter.

Vi er rett og slett glad i å komprimere verden rundt oss, ved å bruke huskeregler. Vi er avhengig av disse huskereglene og sammenhengene våre.  Les setningen under.

A BIRD IN THE

THE HAND IS WORTH

TWO IN THE BUSH

La du merke til at det ene ordet er skrevet to ganger? Faktum er at hjernene våre konstant jobber for å rette feil og finne sammenhenger. Dermed kan vi lett la oss lure.

Det er dette som er narrativ feilslutning. Ved å kategorisere verden, og trekke linjer mellom forskjellige situasjoner har vi lett for å la oss lure, og anta ting som mer eller mindre sannsynlig enn det enkel logikk tilsier. Vår systematisering av verden forandrer oppfatningene våre av den.

Vurder eksperimentet gjennomført av Kahneman og Tversky, hvor en rekke statistikere ble bedt om å gjette sannsynligheten for at de to følgende situasjonene oppstår:

  1. En enorm oversvømmelse et sted i Amerika medfører at over 10.000 personer dør.
  2. Et jordskjelv i California medfører store oversvømmelser, som tar livet av mer enn 10.000 personer.

Mange svarte at tilfelle nummer to er langt mer sannsynlig enn det første. Men faktum er at det første tilfellet inkluderer tilfelle nummer to, og mer til. Fordi vi får satt en klar sammenheng, en fortelling og forklaring, regner vi situasjon nummer to som mer sannsynlig – enda det burde være opplagt at dette ikke er tilfellet. Selv drevne statistikere lar seg rive med!

Tilsvarende for de følgende to setningene, hvilken situasjon fremstår som mer sannsynlig?

Kristian var lykkelig gift. Han myrdet kona si.

Kristian var lykkelig gift. Han myrdet kona si for å få arven hennes.

Setning nummer to virker langt mer sannsynlig intuitivt, nettopp fordi mordet begrunnes. En lykkelig gift man myrder ikke kona si uten videre, det er mer forståelig i situasjon nummer to. Men faktum er at setning nummer en inkluderer mord for arven hennes,  mord fordi kona var utro, mord fordi Kristian var gal og mer til – og er dermed langt mer sannsynlig. System 1 tar likevel snarveien, og gjør at intuisjonen vår tar feil.

Når en gjøres klar over hvilken effekt system 1 har på de logiske slutningene våre, er det enkelt å rette sine feil. Den intuitive feilen begåes ofte fremdeles, men om vi benytter resonnert, logisk gjennomgang kan vi lære å se feilene vi gjør. Ihvertfall til man pakker sammen for dagen, og vandrer hjemover.

Denne typen tankegang er veldig domenespesifikk kunnskap – vi benytter den i en fast etablert omgivelse eller situasjon, og ignorerer den ellers.  Evnen til å se og rette logiske feil i klasserommet, er som oftest bedre enn når vi konfronteres med samme feilen i hverdagen. Da har vi en tendens til å kaste fra oss all faglig vekt, og følge instinktet. Som selvfølgelig gjør av vi tar feil, nok en gang. Dette forklarer hvordan selv drevne empirikere og statistikere kan la seg lure i hverdagslige sammenhenger.

Kort oppsummert så er mennesker dårlig egnet statistikk. Biologisk sett er vi bedre på rask respons enn grundig, logisk gjennomgang av teoretiske problem. Og godt er det – hadde vi vært like godt utviklet for dette som impulsiv slutning hadde vi alle vært prehistoriske snacks.

Verdien av et liv

Hvor mye er et liv verdt?

Uvurderlig? Det er kanskje det vanligste (og enkleste) svaret.

Det har seg dog slik at et liv verdisettes hele tiden. Faktum er at det er for mange tiltak og for mange beslutninger som avhenger av verdien på et liv til at det ikke kan fastsettes. Staten har et fastsatt beløp på verdien av et statistisk liv (VSL) som benyttes i kost-nytte analyser.

Hvor mye kan man begrunne å bruke på en kampanje for å fremme bruk av setebelter? Man får ikke noen direkte fortjeneste av en slik kampanje, fortjenesten kommer indirekte via liv som reddes. For at det skal kunne bestemmes hvor mye man kan bruke på tiltak trenger vi dermed å tallfeste verdien av et liv.

Så hvor mye er et liv verdt?

Kort fortalt: 15 millioner 2005-kroner.

Inflasjonsjusterer vi til dags dato blir dette ca. 18.2 millioner kroner. 

… Hva i all verden, tenker du kanskje. Hvor kommer dette tallet fra? Hva betyr det?

Betydelig lengre fortalt: 
Definisjon på VSL følger:

«VSL er definert som verdien av én enhets reduksjon i forventet antall dødsfall over en gitt periode. Eventuell verdsetting i form av VSL gjelder for små endringer av sannsynligheten for å være utsatt for dødsulykker for et stort antall personer. I samsvar med dette måles VSL med utgangspunkt i forholdsvis store populasjoner der hvert enkelt individs dødssannsynlighet endres svært lite som følge av det aktuelle tiltaket. En reduksjon av risikoen for død med to tusendeler for alle individer i en befolkning på tusen personer vil f.eks. representere en innsparing på to statistiske liv. Det understrekes at formålet med å foreta denne typen verdsetting er å finne den verdien individene tillegger tiltak som marginalt påvirker sannsynligheten for at dødsulykker skal inntreffe. Det gir ikke mening å bruke målet til å verdsette livet på enkeltpersoner eller mindre grupper der endringene av sannsynlighetene for at dødsulykker skal inntreffe er langt større.»

– Veileder i samfunnsøkonomiske analyser, Finansdepartementet (2005)

VSL gir altså den gjennomsnittlige verdien av et «gjennomsnittlig liv». Dette består av en rekke komponenter, men den hovedsakelige verdiskapningen vår er og forblir inntekten vår. Det er dermed naturlig at dette ligger til grunn for utregningen.

Benytter vi verdier fra tidligere innlegg kan vi regne den rent monetære verdien av en livstid med inntekt. Vi tar utgangspunkt i snittinntekt 489.200. Deretter forutsetter vi 45 år med arbeid (f.o.m 20år til 65år.) Verdien av dette idag vil være den neddiskonterte verdien av inntekten. Hva er dette?

Neddiskontering reflekterer det faktum at 100,- om et år, ikke er verdt like mye som 100,- i hånda idag. Får jeg 100,- idag kan jeg sette disse i banken over det neste året, og opptjene rente. Med 3% rente ville 100,- idag dermed være verdt 103,- neste år, eller 100,- neste år være verdt bare (100)/(1+0.03) ≈ 97.087 idag.

Bruker vi 3% diskonteringsrente vil verdien av inntekten vår over tid vil dermed være

489.200 + (489.200)/(1.03) + (489.200)/(1.03)^2 + (489.200)/(1.03)^3 + (489.200)/(1.03)^4 + … + (489.200)/(1.03)^44

ettersom at hvert år vil tjene opp 3% rente, og beløpet som tjenes inn i rente også vil tjene rente over tid (såkalt rentes rente).

Matematisk kan dette skrives som

CodeCogsEqn

som gir oss en verdi temmelig nøyaktig 12 millioner kroner.
Dette er altså verdien en gjennomsnittsinntekt over 45 år har idag. Dersom en 19-åring iferd med å starte i jobb imorgen tragisk blir drept i en bilulykke idag, er dette den forventede verdien av inntekt som går tapt.

Du har kanskje lagt merke til at VSL er en del høyere enn bare denne diskonterte inntekten. Vi ser at inntekten utgjør omtrent 2/3 av VSL. Hvor kommer resten av millionene av?

Denne siste tredjedelen innebærer det som ofte omtales som myke verdier. Dette er menneskelige verdier som man ikke lett kan sette en prislapp på. Det inkluderer den implisitte, uobserverbare verdien en person utgjør. Jeg opplever en verdi av at venner blir med meg på kino, eller at jeg har noen å diskutere med i lunsjpausen. Denne verdien kan i teorien fastsettes ved å finne ut hvor mye jeg hadde vært villig til å betale for det samme selskapet (men dere kunne bare våge). De myke verdiene samler under ett alle disse verdiene en person utgjør. Det er med andre ord en fryktelig vanskelig verdi å fastsette.

Dette er det som grovt sett utgjør VSL, men det finnes ikke en definisjon. Alle beregninger gjøres med forskjellige hensyn, noen land vekter inntekt tyngre, noen legger mer eller mindre verdi i myke verdier. VSL som staten benytter er basert på Europakommisjonens miljødirektorat, og er satt til ca. 15 millioner 2005-kroner. I andre OECD-land ligger verdien som regel mellom 10 og 30 millioner.

Men ikke alle tiltak og beslutninger omhandler dødsfall, man kan ofte høre om tiltak som øker eller senker forventet livstid med et visst antall år. For å få et mer presist anslag når man redder personer med forskjellig alder benyttes dermed også antall sparte leveår som et regnegrunnlag. Helsedirektoratet anbefaler som beste anslag 500.000 2005-kroner for et statistisk leveår med full helse, eller omtrent 606.000 kroner per dags dato. Dette betyr at dersom en operasjon øker forventet levetid (med full helse) med 3 år, så har denne operasjonen i snitt en positiv verdi på 1.8 millioner kroner. Dette tillater å veie kostnaden av operasjonen mot nytten.

For å ta hensyn til relativ livskvalitet benyttes også kvalitetsjusterte leveår som et beregningsgrunnlag. Her regner man om en gitt helsetilstand til et visst antall år med full helse, ved å benytte en skala fra 0 (død) til 1 (helt frisk). En halvveis død person ( altså 0.5 (f.eks en student før morgenkaffen)) vil dermed anslagsvis regnes til 303.000,- per år. En operasjon som øker forventet levetid med 3 år vil her ha en positiv verdi lik 1.5 år ved full helse, lik 909.000,-. Dette kan virke kaldt, men det gir en veldig logisk effekt. Det gjør at det rent økonomisk sett vil være mer lønnsomt å benytte ressurser til å redde en 12-åring enn en 95-åring.

Bør vi sette en kroneverdi på liv og helse?

Det kan synes kontroversielt å sette en økonomisk verdi på liv og helse, og veie verdien av forskjellige mennesker og tiltak mot hverandre. Konsekvensen av å ikke gjøre det kan derimot være at positive effekter ikke blir synlige, og at sikringstiltak ikke fremstår som like attraktive. Ta eksempelet med en kampanje for å øke bruken av setebelter i biler. Om vi ikke tallfester liv og helse vil det ikke være mulig å se noen positive effekter av kampanjen. Tiltak som redder liv og forbedrer helse vil bli lavt prioritert. Tallfesting tillater også at vi får fanget opp «myke» verdier for samfunnet. Bygging av sykkelveier gir ikke bare økt kapasitet på veiene, og redusert reisetid, men også verdien av redusert ulykkesrisiko, en verdi vi ikke ellers hadde vært i stand til å tallfeste.

Det føles likevel rart å tallfeste verdien av et liv, å skulle fastsette hvor mye en person er verdt. Det er, i Thomas Wolfe sine ord, summen av de små øyeblikkene som utgjør livene våre, ikke et sentralt fastsatt verdibegrep. Små øyeblikk som en kopp kaffe tidlig om morgenen.

Når vi fastsetter et statistisk liv til 18.2 millioner kroner utgjør dette 1.4 millioner kopper kaffe til 13,- koppen (en standard kopp kaffe ved SiT Cafe). Med 15 minutter per kaffe utgjør det sammenhengende 39.9 år med kaffedrikking. Det syntes dermed at vi på snitt ihvertfall har 40 år med verdi.

«Should I kill myself, or have a cup of coffee?»

– Albert Camus