The New York City Police Officer Problem

Som et ledd i juleferien min befant jeg meg for et par dager siden på Newark flyplass. En av de første tingene som slo meg i det jeg vandret gjennom terminalen var den enorme mengden med politi tilstede. Det er uvant å se politi vandre rundt i så stort antall i Norge.

En artig detalj med amerikanske politimenn er at de alle går rundt med hvert sitt skilt med deres personlige nummer, såkalt «Badge Number». Dette nummeret er individuelt for hver konstabel, og kan brukes for å identifisere konstabelen i etterkant, dersom man f.eks har en klage. De fleste av oss kjenner til disse fra filmer eller tv-serier – skiltene er sølvfargede, støpt av metall og ser sånn ca. sånn her ut …

NYPD badge

… med små variasjoner i design avhengig av hvilken gren av politiet man er del av, og hvilken rang man har.

Politiet på flyplassterminalen var New York-politi, med logo og bilde av byen stolt vist frem på uniformen. Dette fikk meg til å lure; om New York-politiet også dekker flyplassene i New York, som tross alt ligger i nabostaten New Jersey, trenger de mange konstabler. Hvor mange politimenn finnes det egentlig i New York-politiet? Kan vi estimere det basert på skiltnummerne vi observerer?

Iløpet av gåturen min fikk jeg notert meg skiltnummeret til to konstabler som sto og drakk kaffe; henholdsvis 34440 og 45234. Hva sier dette oss om antallet politikonstabler?  Først og fremst, at det finnes minst to.

Videre kan vi anta at det finnes minst 10.000, differansen mellom det høyeste og laveste tallet vi har observert. Hvorfor ikke bare anta minst 45.000, spør du? Fordi vi har ingen anelse om hvorvidt alle nummerne er i bruk, det kan være at det finnes 30.000 pensjonerte politikonstabler med hvert sitt skilt.

Begynner vi å betvile systematiseringen av nummerne på denne måten er vi plutselig på dypt vann. Vi vet faktisk ikke en rekke ting; hvorvidt alle nummerne er i bruk, hvorvidt nummerne fordeles i strengt stigende rekkefølge (hva om de er tilfeldige?) eller hvorvidt nummerne i seg selv inneholder et internt system, f.eks at alle nummere som starter med 30 hører til på Manhattan.

Denne siste vurderingen virker usannsynlig – da ville vi ikke forventet å finne to konstabler med ulike startsiffere på samme flyplass. Siden ingen av sifferne på de to konstablene stemmer overens er det dermed lite som tyder på internt system i nummereringen på basis av geografisk plassering. Det er hvertfall en start.

Vi har dermed to holdepunkt:

  1. Vi vet at alle nummerne er unike til en politikonstabel. Hvis ikke hadde poenget med nummereringen forsvunnet.
  2. Vi har observert to konstabler med nummer 34440 og 45234.

For å komme videre gjør vi noen grunnleggende antagelser.

  1. Vi antar at nummerne ikke er tilfeldig fordelt, men heller deles ut sekvensielt. Det vil si at hver ny konstabel mottar et nummer høyere enn forrigemann.
  2. Vi antar at konstabler som trer ut av styrken må levere inn skiltet sitt (som ofte dramatisert på tv), og at dette resirkuleres. Skiltnummerne vil dermed tilsvare mengden aktive politikonstabler i styrken.
  3. Vi antar at nummerne ikke inneholder noen form for internt system (geografiske restriksjoner, sjekksummer eller lignende) som vil stride med den tilsynelatende tilfeldige, sekvensielle fordelingen av skiltnummer på tvers av byen ellers. Dette er strengt tatt ikke en nødvendig forutsetning – men den skader ikke for å sikre oss.

Med disse restriksjonene på plass kan vi nå begynne å estimere hvor mange politimenn det er. Vi har altså observert 34440 og 45234. Med antagelsene gitt over kan vi nå estimere at det må være omtrent 80.000 politimenn i New York. Hvordan da?

Vi ser på den totale mengden med politimenn i New York som en samlet populasjon vi trekker tilfeldige utvalg fra (eller tilfeldig observerer med kaffekoppen i hånd). Siden nummerne er sekvensielle fra 1 til maksimalt skiltnummer kan vi dermed vite at snittet av populasjonen vil være lik medianen, og representere den midterste politimannen i styrken. Antall politimenn i New York vil dermed tilsvare to ganger snittverdien av et utvalg som tilnærmer seg uendelig, eller i dette tilfellet, et utvalg som tilnærmer seg den samlede populasjonen vi trekker utvalgene fra. Vi kan dermed estimere (34440+45234) = 79.764 politimenn.

Problemet med dette er selvfølgelig at vi har et forferdelig lite utvalg. Det kan dermed hende at det kun eksisterer 45.500 politimenn, men at vi var uheldige nok til å trekke to tall høyt over snittet. Eller det kan tenkes at det eksisterer 120.000 politimenn, og at observasjonene våre uheldigvis ligger under det reelle snittet. Den eneste måten vi kan forbedre estimasjonen vår er ved å utvide antall observasjoner.

Jeg jaktet videre på politimenn fra New York-styrken, men sine egne skiltnummer. På turen min oppfaget jeg raskt at det også fantes en annen lokal politistyrke, Port Authority, som hadde betydelig lavere skiltnummer på rundt 1000-2000. Disse valgte jeg å ignorere, det var New York-politiet jeg ville finne ut av.

I den ene bokhandelen, med dagens avis i hånden oppdaget jeg en ny konstabel – #15782. Snittet mitt var dermed redusert til omtrent 32.000. På vei tilbake forbi de første to konstablene oppdaget jeg nå en ny, tredje konstabel – #20743; nytt snitt: 29.000

Så, i det vi vandret til gaten for å boarde flyet, fikk jeg øye på min siste politikonstabel, #8372, og med det var mitt endelige snitt 24.932, og det påfølgende estimatet for antall politikonstabler i New York; omtrent 50.000 stk.

Så, hvordan sammenligner dette med det virkelige antallet? Jeg ville anta at estimatat mitt er litt høyt; jeg er vant til å tenke at det er omtrentlig 2 politimenn per 1000 innbyggere – som er gjennomsnittet for Norge. Estimatet jeg her har kommet frem til estimerer nesten tredobbelt av det, med 5.8 politimenn per 1000 New Yorkere. Det er kjent at New York har usedvanlig mange politimenn iforhold til innbyggere, men tredobbelt av vanlig størrelse virker i overkant mye. Jeg ville heller estimert omtrent halvannen gang så mye, altså 3-3.5 per 1000.

Ifølge NYPD selv har de omtrent 40.000 politimenn, som tilsvarer 4.7 politimenn per 1000. Med utgangspunkt i kun 5 observasjoner jeg ganske fornøyd med estimatet på 50.000 – det ligger forholdsvis nærme. Hadde jeg kun gjettet, basert på 3 per 1000-antagelsen, ville tilsvart en estimert politistyrke på 25.500, halvannen gang så feilaktig som utvalgsestimatet mitt.

Denne typen problemstilling er forholdsvis kjent innenfor statistikk, og går under navnet «The German Tank Problem». Under andre verdenskrig ønsket de allierte styrkene å estimere antall tanks tyskerne hadde tilgjengelig – for å kunne bedømme hva slags motstand de kunne forvente seg. Hvordan kunne man best mulig gjøre dette? Løsningen var ganske enkel – de tyske produsentene av tanks hadde, i ekte tysk ingeniørånd, merket alle delene av stridsvognene de bygget med serienummer, fordelt sekvensielt etterhvert som nye tanks ble produsert. Det betød at hver gang de allierte styrkene fanget eller ødela en tysk tanks kunne de notere seg serienummerne, regne snittet på ny, og estimere en ny størrelse på det totale antallet tanks. Etterhvert som flere og flere tanks ble tatt ut av spill ble estimatet mer og mer presist. Resultatet for produksjonen av amerikanske stridsvogner var også ganske umiddelbar – alle serienummer i amerikanske tanks ble randomiserte. Slik kunne man forhindre at tyskerne vendte statistikken tilbake mot dem.

 

Kasseeffisienshypotesen

Dette er kun en formalisering av en modell som virker implisitt kjent av alle samfunnsøkonomistudenter  og -professorerer ved NTNU Dragvoll.

Modellen er en (svært) kortsiktig modell, den tar for seg umiddelbar tilpasning i kiosken på Dragvoll iløpet av få minutter. Den er dermed ikke presis på lengre sikt.

Vi antar at en hver kunde i kiosken har en nytte av kjøpet som er en funksjon av to parameter, pris (P) og tid i kø (T).

En høyere pris på goder tilsier at kunden er mer desperat for et gode. Vi er ikke like avhengig av en liten sjokolade til 5,- som en full lunsj med drikke til 65,-. Har kunden først bestemt seg for å kjøpe en godekombinasjon til en høy pris har individet rasjonellt bestemt seg for at nytten av disse godene overstiger betalingsviljen – og en høyere pris reflekterer dermed en høyere nytteverdi for kunden.

Tid brukt i køen er (om vi ser vekk fra prokrastineringsformål) et ensidig negativt parameter. Vi liker ikke å stå i kioskkø. Desto lenger vi står i kø, desto mindre blir nytten vår. Etterhvert som T går mot store verdier vil nytten av selv høyt prisede godekombinasjoner gå mot null – kunden går lei og går sin vei (antageligvis til kantina eller kaféen for å handle der istedet).

Kundens nytte kan dermed generaliseres som

U = P – T^2

På motsatt side av transaksjonen har kiosken en nytte av salg avhengig av to parameter, pris (P) og kostnaden ved å ha en kasse åpen (C).

En høyere pris reflekterer en høyere transaksjonsverdi for kiosken, og er dermed en positiv ting. Kostnaden av å ha en kasse åpen er lik kostnaden av at en enkelt ansatt ikke kan bedrive en ellers ønskelig aktivitet (som å stable varer på lager langt vekk fra masete kunder, lese bok på bakrommet eller sjekke Reddit).  Å åpne flere kasse er dermed initielt en kostnad for kiosken.

I kioskens tilpasning av antall kasser som skal åpnes er det dermed tre nøkkelparameter som veier inn, verdien av kundene som står i kø (Antall * Pris), sannsynligheten for at de stikker (som en økende sannsynlighetsfunksjon av tid i kø, P(t)) og kostnaden av å åpne en ekstra kasse (C).

Vi antar at kiosken til enhver tid har en kasse åpen.

Optimaliseringsproblemet kiosken står overfor er dermed en funksjon av disse tre parameterne

Åpne kasse? = f(N*P, P(t), C).

Det sier seg selv at for lave mengder kunder, det vil si at N*P og P(t) er små, vil det ikke lønne seg å åpne en ny kasse. En kasse vil klare å håndtere kundestrømmen raskt og effektivt nok til at ingen kunder velger å ombestemme seg.

Dersom mengden kunder øker til middels må kiosken ta en ny vurdering. Med en gang verdien av kunder som ombestemmer seg grunnet lang kø overstiger kostnaden av å åpne en ny kasse vil kasse nummer to åpnes. Dette vil vedvare til køen er kortet nok ned til at en kasse igjen optimalt kan håndtere kundestrømmen.

Når mengden kunder øker til høy vil dette begrunne åpning av enda en kasse.

La oss nå ta en titt på kassekonfigurasjonen i kiosken. Den ser ut som gitt nedenfor. Kasse 1 håndterer Kø 1, Kasse 2 og 3 håndterer Kø 2.

kassekonfigurasjon

Vi antar at behandlingstiden per kunde er konstant og lik for alle kasser. Videre antar vi at det finnes to typer kunder, et stort antall Generelle Studenter, og et lite antall Studenter Som Har Hatt Optimaliseringsteori (også kalt Økonomistudenter eller Nerder)

Generelle Studenter tilpasser seg ved et raskt øyekast over køen. Dersom Kø 1 er lenger enn Kø 2 vil de stille seg i Kø 2, og motsatt. Generelle Studenter vil dermed medvirke til at Kø 1 og Kø 2 (gitt at Kasse 2 har blitt åpnet og Kø 2 eksisterer) er like lange. 

Hva er da rasjonell tilpasning for Studenter Som Har Hatt Optimaliseringsteori?

Utifra optimaliseringen ovenfor er det dermed gitt at dersom kundemengden er av et slikt volum at Kasse 2 er blitt åpnet vil Studenter Som Har Hatt Optimaliseringsteori alltid velge å stille seg i Kø 2.

Dette kan begrunnes av at det alltid vil lede til ett av de to følgende scenarioene:

  1. Køene er like lange, behandlingstiden er like lang, men volumet er ikke stort nok til å legitimere åpning av Kasse 3. Det vil dermed ta like lang tid i Kø 2 som i Kø 1.
  2. Køene er like lange, behandlingstiden er like lang, og volumet er stort nok til at Kasse 3 åpnes. Da vil tiden i Kø 2 plutselig være halvparten av den i Kø 1.

Er Kasse 3 åpnet vil dette være et argument for at Kø 2 rasjonellt sett skal være dobbelt så lang som Kø 1 for at alle skal oppleve like lang behandlingstid! Likevel er dette (bemerkelsesverdig nok) nesten aldri tilfellet.

Studenter Som Har Hatt Optimaliseringsteori kan stadig vekk nyte en kortere behandlingstid i Kø 2 enn Kø 1, fordi den generelle tilpasningen av å stille seg i den korteste køen ikke er optimal adferd!

Hurra for optimaliseringsteori!

(Og til alle som nå kjenner seg litt snurt over de dyrebare sekundene som over årene har forsvunnet fordi man har valgt Kø 1 – dere kan trøste dere med at denne Nerden nettopp har brukt opp all den inntjente tiden, og mer, på å påpeke dumheten)

Verdien av en stemme (gitt at du faktisk stemmer)

Når du stemmer på et parti ved stortingsvalg, gir du en stemme til en plass på Stortinget for partiet. Du utgjør dermed en liten del av et mandat, som er en liten del av et Storting, som skal fastsette statsbudsjettet. Så hvor mye er din stemme verdt i det store og det hele?

For ordens skyld, jeg vet at det er kommunevalg i år – men det finnes naturligvis hittil lite statistikk for årets valg, så jeg har istedet bestemt meg for å benytte talldata fra Stortingsvalget i 2013. Det fungerer også litt bedre sånn rent logisk, siden det er Stortinget, ikke kommunene, som fastsetter statsbudsjett (og jeg gidder ikke å sette meg inn i kommunaløkonomi helt ennå).

Problemet med å beregne verdien av en stemme i Norge er at valgsystemet vårt er litt merkelig satt opp. For vi stemmer inn 169 mandater til Stortinget, men disse mandatene er fordelt forskjellig mellom de forskjellige fylkene.

Hvordan fastsettes denne fordelingen? En logisk løsning virker å vekte hvert fylke utifra befolkning; flere mennesker skal ha større påvirkning – og dermed flere stemmer. Problemet med dette er at store fylker vil få en veldig liten påvirkning relativt til areal. Finnmark, som er ti ganger større enn Akershus, vil kun ha en tiendel av påvirkningen til Akerhus. Dette er uheldig, da større areal krever større investeringer for å holde veier o.l. ved like. Samtidig fungerer det dårlig å vekte kun på areal, da vil Finnmark plutselig vektes 107 ganger tyngre enn Oslo, enda det bare bor omtrent 75 000 personer i fylket.

Løsningen har, på magisk vis, blitt følgende formel: Totalt areal i fylket, ganget med 1.8 (jeg forsøkt å forstå hvorfor, og jeg aner ikke. Magisk se-så-stort-fylket-vårt-er-multiplikator!) pluss befolkningstallet i fylket. Om man så summerer dette tallet for alle fylkene, og finner andel for hvert enkelt fylke, har vi vektingen av mandater. I tall ser dette sånn ut:

Fylke Areal (km^2) Befolkning Areal*1.8 + Befolkning Mandatvekt Mandater (ifølge regel) Mandater (faktisk)
Akershus 4,918 584,899 593,751 0.1033 17.46 17
Buskerud 14,910 274,737 301,575 0.0525 8.87 9
Hedmark 27,397 195,153 244,468 0.0425 7.19 7
Møre & Romsdal 15,113 263,719 290,922 0.0506 8.55 9
Nord-Trøndelag 22,414 135,738 176,083 0.0306 5.18 5
Oslo 454 647,676 648,493 0.1128 19.06 19
Sogn & Fjordane 18,623 109,170 142,691 0.0248 4.19 4
Telemark 15,299 171,953 199,491 0.0347 5.86 6
Vest-Agder 7,276 180,877 193,974 0.0337 5.70 6
Østfold 4,182 287,198 294,726 0.0513 8.66 9
Øst-Agder 9,158 114,767 131,251 0.0228 3.86 4
Finnmark 48,615 75,605 163,112 0.0284 4.80 5
Hordaland 15,440 511,357 539,149 0.0938 15.85 16
Nordland 38,460 241,682 310,910 0.0541 9.14 9
Oppland 25,189 188,807 234,147 0.0407 6.88 7
Rogaland 9,375 466,302 483,177 0.0841 14.20 14
Sør-Trøndelag 18,855 310,047 343,986 0.0598 10.11 10
Troms 25,869 163,453 210,017 0.0365 6.17 6
Vestfold 2,224 242,662 246,665 0.0429 7.25 7
Totalt 323,771 5,165,802 5,748,590 169 169

Okai, mye tall på en gang. «Mandatvekt» gir her hvor stor andel av det totale antallet mandater et fylke skal ha. Akerhus skal f.eks ha 0.1033, eller 10.33% av alle mandatene – som tilsier at de skal ha 17.46 av 169 mandater. Dette stemmer godt da de har 17.

Nå som vi har funnet vektingene kan vi ta snittet av dette over de nitten fylkene for å finne den gjennomsnittlige effekten av en tilfeldig trukket norsk velger. På snitt har fylkene et areal på omtrent 17.000 kvadratkilometer, og en befolkning på 272.000 personer. Det gir en mandatvekt på 0.0526, som tilsier 8.89 mandater.

Et gjennomsnitt av fylkene vil dermed se ut som følger:

Personer Antall mandater Stemmer per mandat En stemme utgjør
271,884 8.89 30566 0.0000327% av et mandat

Men! Her har jeg gjort en kritisk feil. Det stemmer nemlig ikke at alle i Norge har stemmerett. Av de 5.1 millioner menneskene som var bosatt i Norge i 2013 var det kun 3.640.000 som faktisk var stemmeberettiget. Hvis vi antar at de stemmeberettigede er likt fordelt som befolkningen ellers, vil mandatvektene forbli uforandet – en av fordelene med med å benytte brøk. Da kan vi regne andelen hvert fylke har av total befolkning, og gange det med antall personer som har stemmerett for å få et nytt anslag på personer som skal stemme i hvert fylke.

Dermed får vi et gjennomsnitt av fylkene:

Personer Antall mandater Stemmer per mandat En stemme utgjør
191,671 8.89 21548 0.0000464% av et mandat

Men det er heller ikke alle med stemmerett som velger å stemme.  Ved stortingsvalget i 2013 var det 78.3% valgdeltagelse. Valgoppslutningen er ulikt fordelt utover landet. Det er kjent at østlandet har notorisk lavere oppslutning enn andre deler av landet. For enkelthetens skyld velger jeg likevel å anta at det er en lik fordeling, slik at jeg kan benytte snitt, istedet for å måtte vekte hvert fylke med sine mandater mot relativ valgoppslutning. (Fordi, jeez, jeg er ikke så nerdete.)

Da får vi, igjen på snitt:

Personer Antall mandater Stemmer per mandat En stemme utgjør
150,053 8.89 16870 0.0000593% av et mandat

Vi ser dermed at om alle stemmeberettigede i Norge hadde stemt, ville deres stemme representert 1.4 personer av den totale befolkningen. Tilsvarende representerer de som faktisk stemmer 1.8 personer av den totale befolkningen.

Det vil si at dersom du stemte i 2013 telte din stemme 27% mer enn den hadde gjort om alle som kunne stemt, hadde gjort det. 

Så, hvor mye er en stemme egentlig verdt?

Statsbudsjettet i 2013 var på 1037 milliarder kroner. Dette budsjettet godkjennes av flertallet i Stortinget. Det vil si at en stemme utgjør 0.0000593% av 1/169 (ett mandat) av budsjettet på 1037 milliarder.

Din stemme er dermed vært omtrent 363 728 kroner. 

Det må nevnes at dette ikke nødvendigvis blir helt korrekt. Stemmen din vil strengt tatt utgjøre den betingede verdien av at du stemmer på en kandidat som får et mandat, som er med på å utgjøre en forskjell i Stortinget som godkjenner budsjettet. Om man stemmer på Kystpartiet, og de ikke får noen mandater har man jo på sett og vis ‘kastet bort’ stemmen sin. Men det vil altså avhenge av hvordan alle andre stemmer. Er du den eneste som stemmer kontrollerer jo plutselig Kystpartiet hele stortinget, og da blir stemmen din lik verdien av det totale budsjettet. Hot damn!

Prinsippet står uansett. Stemmeretten din er verdifull. Sørg for å bruke den 🙂

Hvor rike er vi egentlig?

«Hva? Det går ikke ann! Også i verdens riskeste land!?»

Det er ikke sjeldent at nasjonalformuen vår trekkes frem. Enten det er manglende kvalitet på offentlige tilbud, eller et lettet sukk over hvor godt vi har det mens vi sitter med café latte på bryggekanten. Men hvor rike er vi egentlig?

Om du er en fast leser tenker du kanskje «Ånei, nå skal Martin trekke frem oljefondet igjen. Get over it?» Slapp av. Ja, det er sant at vi har oljefondet, og at det er vanvittig stort (se bare her). Men dette innlegget skal ikke handle like mye om hvor rike vi er, som hvordan vi er rike.

Norge scorer gang på gang i toppsiktet av Human Development Index. Vi ligger blant de øverste landene i verdiskapning per innbygger og har gjentatte ganger blitt kåret verdens beste land å bo i. Og samtidig  er ting langt fra perfekt – vi har smale veier, vi klager på fulle busser og trikker, på lange sykehuskøer og manglende plasser i eldreomsorgen. Hvordan kan det ha seg at vi har det så godt, og fremdeles mangler så mye?

New York Times publiserte i 2005 en artikkel der de hevdet at Norge ikke kan være spesielt rikt. For i Norge er det dårlig utvalg av bøker på bibliotekene, vi har hullete veier, og mens arbeidere i New York og Paris stikker ut til en lokal deli for en varm lunsj spiser vi matpakker. Hvordan kan et land være rikt om innbyggerne er nødt til å spise matpakker? Utlendinger som kommer til Norge blir overrasket over mangelen på overdådig luksus når de vandrer rundt. Det kryr ikke av italienske sportsbiler, skreddersydde dresser og kabrioleter? Hvor er Rolex og Breitling-klokkene?

Et viktig spørsmål er hvordan vi måler rikdom. Bruttonasjonalprodukt per capita brukes ofte som et vanlig mål på dette. Bruttonasjonalprodukt er, helt enkelt, summen av all verdiskapning i et land over et år.  Alle norske bedrifter og fabrikker, private selskap, statlige og frivillige organisasjoner skaper av verdier. Alle som benytter penger i Norge skaper en verdi for noen – og vi kan i løpet av et år summere alle disse verdiene til total verdiskapning i landet. Når dette deles på innbyggere i landet (per capita) får vi et mål på hvor store verdier vi har produsert per innbygger.

Dette er det økonomer omtaler som BNP per capita. Her ligger Norge på omtrent 613.000 kroner, og er at av de øverste landene på listen.

Dette er dog et veldig dårlig mål på rikdom innad i et land. Det oppgir verdiskapningen, men sier ingenting om fordelingen av verdien innad i dette landet; velstanden. Vi kan rett og slett ikke si hvorvidt alle produserer rundt 600.000, eller om en person alene står for all produksjon i landet (og dermed trekker snittet opp for alle andre.) Landets totale rikdom er upåvirket av fordelingen – hvorvidt en person sitter med alle pengene eller om det er jevnt fordelt spiller ingen rolle. Men det gjør det jo for oss. Vi ønsker å finne hvordan velstanden er i landet, vi er interessert i å finne hvor rike folk flest er.

En kort digresjon begrensning av variable, og forståelse av snitt

Formue er en interessant variabel. Mange størrelser i verden er naturlig fordelt og begrenset i sin skala –  formue er ikke en av dem. Det er lett å tenke at høy snittformue tilsier at folk er rike i et land, men formue er en av de variablene i samfunnet som ofte er veldig skjevt fordelt. Formue følger ikke en naturlig normalfordeling, og enkelte observasjoner kan lett føre til stor skjevhet i snittet.

Et tankeeksperiment:

Still 10 personer på rad, og mål høyden deres. Vi finner kanskje et snitt på 1.75m, noe som virker ganske riktig. For hver person vi finner som er 2m, finner vi tilsvarende også en person som er 1.50m. Hvis vi øker antall personer til 1000, vil vi være enda nærmere det sanne snittet. Ekstreme observasjoner, som en person på 2.20m, vil dra opp snittet med knappe 2.2 millimeter.

La oss nå gjenta det samme eksperimentet, men denne gangen måle formuen til personene. En er underbetalt barneskolelærer, en annen en godt betalt petroleumsingeniører, osv. Vi finner snittet for 999 personer på rad. Så legger vi til Bill Gates som person nummer 1000. Med en formue på over 700 milliarder kroner, vil snittet nå plutselig vise en gjennomssnittsformue blant de oppmøtte på over 700 millioner kroner hver, noe som virker litt usannsynlig for barneskolelæreren vår. Selv ikke petroleumsingeniøren virker sannsynlig å ha 700 millioner på bok.

Formue har ingen naturlig begrensning i skala, det er ikke en fysisk verdi – og enkelte observasjoner (sånn som Bill Gates) kan villede hele oppfatningen vår av snittet. Dette er ikke et problem for naturlige begrensede variable, sånn som høyde. Det er fysisk umulig at person nummer 1000 i rekka er 220km høy.

Formue er et eksempel på en variabel som følger Paretoprinsippet, Zipf’s lov, eller «80/20-regelen«. Poenget er skremmende enkelt; for mange fenomen vil omtrent 80% av konsekvensene komme av 20% av hendelsene.

For eksempel vil:

  • 80% av inntektene tilfalle 20% av befolkningen.
  • 80% av salgene komme fra 20% av kundene
  • 80% av verdens netttrafikk gå til 20% av nettsidene
  • 80% av verdiskapning i filmindustrien komme fra 20% av filmene
  • 80% av bruken av det engelske språk benytte bare 20% av ordene

Dette er kjent som potensloven (Power law).

Formue er altså ikke normaltfordelt av natur, så gjennomsnitt av formue i et land er ikke et godt mål på et lands rikdom. Hvertfall ikke alene.

Hvor rike er folk flest?

Det er opplagt at vi trenger mer enn bare snittet for å kunne utrykke oss om folk flest. Vi trenger å vite mer om fordelingen i samfunnet. Innenfor statistikk sies en fordeling å ha fire moment:

  1. Gjennomsnitt
  2. Varians
  3. Skjevhet
  4. Kurtose

Disse fire momentene beskriver hvordan en sannsynlighetsfordeling ser ut.

Varians sier noe om hvor stort avviket er fra snittet kvadrert. Vi bruker dermed ofte standardavvik istedet, som er roten av variansen. Jeg tillater meg å låne fra en av mine egne facebook-statuser:

Innenfor statistikk benyttes standardavvik for å måle hvor langt unna gjennomsnittet dataverdier gjennomsnittlig observeres.

Om en snittverdi er 20 og standardavviket er 5, sier vi ved normalfordeling at 68% av alle observasjoner ligger mellom 15 og 25, +- ett standardavvik.

Tilsvarende vil 95% av alle observasjoner ligge mellom 10 og 30, +- to standardavvik.

99,7% av alle observasjoner vil ligge mellom 5 og 35, +- tre standardavvik. Om du plukker tilfeldige datapunkt vil du kun finne punkt som ligger utenfor [5, 35] 3 av 1000 ganger

Skjevhet og kurtose sier noe om effekten ekstremalverdier har på resten av fordelingen. Jeg skal ikke skrive så mye om disse nå, men heller ta for meg variansen.

Et tankeeksperiment til:

Se for deg at vi stiller opp tre norske og tre amerikanske arbeidere. Begge gruppene består av en sykepleier, en lærer og en tannlege. Den norske sykepleieren tjener 300.000, læreren tjener 400.000 og tannlegen 500.000. Tilsvarende tjener den amerikanske sykepleieren 100.000, læreren 300.000 og tannlegen 700.000. I dette eksperimentet har de norske arbeiderne et snitt på 400.000, og amerikanerne et snitt på 367.000. Vi sier altså at de norske arbeiderne er rikere enn amerikanerne.

Men den best betalte av de norske arbeiderne tjener kun 67% mer enn den med lavest inntekt, mens den amerikanske tannlegen tjener 7 ganger mer enn den amerikanske sykepleieren. Den amerikanske tannlegen kunne jobbet i litt over syv uker og ansatt sykepleieren som sekretær resten av året.  I Norge må tannlegen bruke to-tredeler av året på å betale lønna til sykepleieren.

Her er det opplagt at snitt og varians er to veldige forskjellige ting. De rikeste i Norge er kanskje ikke så mye rikere enn resten, sett med utenlandske øyne, men samtidig har vi også ytterst få som er veldig fattige. Vi har veldig lite sprik i inntekt mellom lønnstakere i Norge. I  NOU 2000:21 «En strategi for sysselsetning og verdiskapning» (må ikke blandes med NOU 2001:20 «Lov om introduksjonsordning for nyankomne innvandrere«, slik jeg gjorde) trekkes det frem at

I Norge tjente lønnstakeren i den øverste desilen (D9) 2 ganger så mye som den personen som bare hadde 10 prosent av lønnstakerne under seg. I Nederland var forholdstallet over 2,5 mens både portugiseren, canadieren og amerikaneren på toppen av lønnspyramiden (D9) tjente mer enn 4 ganger så mye som han, eller kanskje mer sannsynlig hun, som bare har 10 prosent av lønnstakerne under seg. Sammen med Sverige og Danmark er Norge det OECD landet med desidert minst lønnsforskjeller.

Det er nemlig variansen i formue som skiller Norge ut blant mange andre land. For selvom snittet i USA og Norge er relativt likt (omtrent 451.617 og 613.000) er forskjellen mellom fordelingen innad i disse landene stor. I Norge er fordelingen relativt jevn. I USA har vi derimot dette:

Hvorfor tjener norske kelnere så godt?

Norsk arbeidskraft er dyr. Og nesten alt av varer i Norge må på et eller annet tidspunkt behandles av norsk arbeidskraft. Ergo blir de fleste norske varer dyre. Det er en grunn til at italiensk vin og kinesiske replikaer er så billige – fordi lønningene i disse landene er såpass mye lavere. De aller fleste varer er dyre relativt sett, når vi måler prisene i utlandet mot tilsvarende norske priser.

Norge er et kunnskapssamfunn. I det internasjonale markedet har vi spesialisert oss på å produsere dyre, kompliserte ting som krever mye utdanning og kompetanse. Dette er ting vi dermed klarer å tilby på det internasjonale markedet for en billig penge, relativt sett til konkurrenter. Enklere grovarbeid er vi dermed ikke like konkurransedyktige på; med høye norske lønninger er det vanskelig for oss å konkurrere mot andre land. Dermed blir ting som internasjonalt er dyrt, billig i Norge, og ting som er billig internasjonalt blir dyrt.

Det er her skillet mellom konkurranseutsatt-sektor (K-sektor) og skjermet-sektor (S-sektor) kommer på banen. Siden teknologien vi eksporterer er såpass kompleks skaper K-sektor mye verdi målt i dollar for de arbeidstimene som settes inn. Dette tillater K-sektor å betale godt for arbeidskraften, og det vil bli lønnspress mellom bedriftene for å få kvalifisert arbeidskraft. Samtidig konkurrerer K-sektor på det internasjonale markedet, og må dermed ta prisen som bestemmes i dette markedet. Prøver de norske bedriftene å ta høyere lønn enn verdensmarkedsprisen kan man jo alltids finne franske, amerikanske eller koreanske ingeniører som kan gjøre den samme jobben. Eksportindustrien går dermed på en knivsegg mellom fastsatt lav pris, og høye lønninger. De som ikke kan betale høye lønninger får ikke arbeidskraft, men blir de for høye er ikke bedriften lønnsom.

Lønnsveksten i K-sektor velter også over på S-sektor, den skjermede sektoren. Denne sektoren består av alle bedrifter som ikke er utsatt for utenlandsk konkurranse – som frisører, elektrikere og lignende. S-sektor har den fordelen at de ikke konkurrerer på verdensmarkedet, og kan dermed sette prisen selv. Så lønningene kan settes slik at de konkurrerer med K-sektor, og deretter kan bedriftene velte kostnadene sine over på kundene i form av økte priser. Da øker inntektene og utgiftene likt. Det er dermed en tendens til at land med god K-sektor møter høye priser i S-sektor.

Dermed blir det dyrt å kjøpe varer i Norge. For øl serverer ikke seg selv, vaskemaskiner installeres ikke på egenhånd og personlig aner jeg ikke hvordan et kassaapparat fungerer. Og når alternativet er at kelneren, montøren eller butikkarbeideren kunne jobbet i Statoil eller Kongsberg Gruppen må lønnen være høy. Norsk arbeidskraft er godt betalt fordi vi får mye verdi ut av timene – arbeidskraften er dyr fordi den er god.

Dessuten har den norske befolkningene høy betalingsvilje fordi vi har høy betalingsevne. Vi er villig til å betale mye for en øl på Grünerløkka, fordi vi har råd til den. Og vi godtar høye priser lokalt fordi alternativet er verre – en øl på Grünerløkka er likevel billigere enn en tur til München for en billig øl der.

På tvers av daler og fjell

Norge er et langt og utstrakt land. Store deler av verdiskapningen i landet vårt må brukes på å rydde veier, isolere mot kulden og frakte varer langt. Den norske befolkningen bor spredt utover enorme landeområder – noe som koster store summer, til veier, transport, strømnett, sykehus, skoler og mer til.

Innenfor økonomisk teori finnes begrepet stordriftsfordeler. Dette tar for seg at det er billigere å gjøre ting i større skala, en slags kvantumsrabatt. Det er billigere å bo sammen med noen, enn å bo alene – plutselig trenger man bare et bad, et kjøkken, og en tv, istedet for to av alt. Det samme gjelder på landsbasis. Det er billigere å ha mange boende i en stor by med et stort sykehus, en i to byer med hvert sitt sykehus. Det er billigere å bygge bygater i en storby, enn mange bygater i mange små byer, med broer og tunneler som knytter dem sammen.

Men likevel har vi altså distriktspolitikk i Norge – vi tillater oss å benytte store summer på at folk skal ha mulighet til å bo hvor de vil. Vi har ikke høykvalitetsveier som Autobahn i Tyskland – men til gjengjeld har vi veldig mye veier, som snirkler seg over fjell og gjennom daler – som tillater oss å bo hvor vi vil. Vi har små og store sykehus landet igjennom, vi har skoler i småbygder. Vi bruker enorme mengder midler på å opprettholde distrikspolitikken, til tross for at det er dyrere. Vi har tatt oss råd til å bo der vi vil.

Rikdommens bekreftningstendens

Når man vandrer rundt på Manhattan, eller i finanskvartalet i London er det vanskelig å ikke bli blendet av velstanden. Det er dyre biler på veiene, det er få dresser som ikke er skreddersydde og Rolex-klokkene glinser i solen. Men det er viktig å huske at dette ikke er et representativt for landet – de personene man møter på Manhattan er først og fremst de personene som har råd til å bo der. Vi ser ikke de fattige, som er stuet vekk i ghettoer eller campingvogner og som knapt eier noe. I møte med ekstrem velstand har vi lett for å lure oss selv, og anta at det er dette som er standarden. Dette er et eksempel på bekreftningstendens, som blir omtalt i  dette innlegget.

Så når vi er rike i Norge, kan vi si at vi er rike uten å ha mange som er rike. Mens noen i utlandet har 400 kvadratmeter villa med svømmebasseng, og noen knapt har vegger og tak, har de fleste i Norge en bolig av grei standard. Mens noen i utlandet har 4 biler, og andre har ingen har de fleste norske husstander en. Vi har valgt bort den ekstreme luksusen for skole-, helse- og omsorgsordninger, for sykeordninger og svangerskapspermisjoner, for folketrygd og felles fordeling av kaken. Vi har valgt å bo spredt, og reise langt. Vi holder veier over fjellet vinteråpne med brøytebiler, vi bygger broer og tunneler på tvers av daler og fjorder, vi har hytter på fjellet og båter i skjærgården.

Rikdommen vår er ikke alltid like lett å se, for selv de mindre bemidlede går i moteklær, kjører bil og bor i hus. I andre land er de stuet vekk i slummen, med knapt noen midler.

Så når turister kommer på besøk og spør hvor rikdommen er, vet du hva du kan svare: vi er rike samlet sett. Vi har valgt å benytte rikdommen vår utover hele landet, og hele befolkningen.

…Og om det ikke er nok kan du alltids linke dem til Oljefondet.

Biologiske fallgruver – eller hvorfor mange hater statistikk

Statistikk er ikke et enkelt fagfelt. Det er lett å se systemer og sammenhenger som ikke nødvendigvis er der, og det kan være vanskelig å finne de sammenhengene man skulle ønske lå til grunn. Utallige antall studenter har gjennom tidene sittet og forbannet statistikkfaget for at det er så lite samarbeidsvillig. Men hva er det som gjør statistikk såpass vanskelig?

En del av svaret ser ut til å være så grunnleggende som menneskelig biologi.

Men før jeg legger ut om dette vil jeg gjerne snakke litt direkte til deg.

Ja, deg ja.

Jeg har nemlig gjort litt research på hvem leserne mine er, og tror jeg har ganske god oversikt. Jeg skal dermed forsøke å beskrive nettopp deg, kjære leser, med et kort lite avsnitt. Jeg beklager hvis dette blir litt personlig.

Du har et stort behov for at mennesker skal like og beundre deg. Du har en tendens til å være selvkritisk. Du har en stor porsjon ledig kapasitet som du ennå ikke har dratt fordel av. Selv om  du har enkelte svakheter i din personlighet, har du i all vesentlighet evnen til å kompensere for disse. Utenpå er du disiplinert og underlagt stor selvkontroll, men innvendig bekymrer du deg i større grad, og er usikker. Du tviler iblant sterkt på om du har tatt de riktige beslutningene, og gjort det som er riktig. Du foretrekker en viss grad av variasjon, og blir lite tilfreds når du blir hemmet av begrensninger og bestemmelser. Du vurderer deg selv som en selvstendig tenker og godtar ikke andres uttalelser uten tilfredsstillende bevis. Du har funnet ut at det ikke er lurt å være for direkte i utleveringen av seg selv i omgang med andre. Til tider er du utadvendt, omgjengelig og sosial, mens du andre ganger er innadvendt, skeptisk og reservert. Enkelte av dine ønsker kan være ganske urealistiske. Sikkerhet er et av dine store mål i livet.

Forvirra? Jeg kommer tilbake til dette om litt.


System 1 og 2

Økonomen Daniel Kahneman fikk i 2002 nobelprisen i økonomi (eller Sveriges Riksbanks pris i økonomisk vitenskap til minne om Alfred Nobel, for kverulantene der ute) for arbeidet sitt innenfor beslutningsteori – hvordan mennesker tar de valgene de gjør. Han ga i 2011 ut den bestselgende boken Tenke, fort og langsomt, hvor han presenterte en del av tankene sine,  og hvor han deler menneskelig bevissthet i to deler, system 1 og 2.

System 1 er automatisk, raskt og uanstrengt – vi er som regel ikke klar over at vi bruker det. Det er dette vi omtaler som intuisjon eller instinkt. Det er sterkt påvirket av humør og emosjonell tilstand, og benytter seg av snarveier og sammenhenger for å jobbe kjapt og effektivt. Fordi det er såpass raskt og emosjonellt kan det ofte medføre alvorlige feil i resonnementet vårt. «Fort og gæli'» er en god beskrivelse.

System 2 er det kognitive tankesystemet – bevisst tankegang. Det er dette vi benytter i klasserommet, når vi jobber bevisst med oppgaver. Det er tungt og resonnert, tregt og logisk, progressivt og selvbevist. Det gjør færre feil enn det instinktive systemet, og siden vi vet hvordan vi har nådd en konklusjon kan vi jobbe oss bakover i beslutningsprosessen og rette egne feil.

Mange av feilene som oppstår ved behandling av tall og statistikk kommer av at vi benytter system 1 istedet for 2. Dette skjer nettopp fordi et av kjennetegnene ved system 1 er at vi ikke vet vi benytter det. Vi når et svar og en konklusjon uten å vite hvordan vi fant den.

Det er en veldig god grunn til dette. Hadde det ikke vært for vår utbredte bruk av system 1 hadde antageligvis få av oss vært her idag. Dersom forfedrene våre hadde stoppet og vurdert hvorvidt sabeltanntigeren var en trussel, istedet for å løpe, hadde vi ikke eksistert. System 1 er  designet for rask vurdering av omgivelsene våre, og hurtig respons. Det er det som får oss til å løpe når vi oppdager at vi er i trøbbel. Så når man i matematikk eller logiske problemer trekker en rask og feilaktig konklusjon er det fordi system 1 ønsker å gi oss en hurtig løsning, for å hjelpe oss ut av problemet. Som ironisk nok ofte bare leder til mer problemer.

Dessverre sliter vi med å bruke system 2 like aktivt som vi gjerne skulle, uten å behøve en ferie etterpå. Det er tungt å skulle bevisst resonnere seg frem. Det er slitsomt. Det hender også at vi tar intuisjonen vår for god fisk, at vi rett og slett glemmer kritisk gransking. Konsekvensen av dette er at vi i stor grad lener oss på system 1 – og dermed begår en rekke åpenbare feil i resonnementene våre.  Jeg har lyst til å skrive litt om to konkrete feil, bekreftelsestendens og narrativ feilslutning, som er spesielt utbredte.

Bekreftelsestendens

Bekreftelsestendens (på engelsk: confirmation bias) omhandler at vi har en tendens til å søke informasjon som bekrefter tankene våre. Dette kan  medføre at vi velger å utelate informasjon som strider med det vi tror stemmer, og dermed styrke en ubegrunnet antagelse. En person som er for strengere våpenkontroll vil søke etter nyheter og personer som støtter sitt eget synspunkt. Etter en skyteepisode vil personen velge å tolke informasjonen om hendelsen på en måte som støtter opp under tankene om at strengere våpenkontroll er viktig. F.eks

«Hadde vi hatt strengere våpenkontroll ville færre personer fått tak i våpen, og det ville blitt færre skyteepisoder.»

En person som er mot våpenkontroll vil derimot oppleve akkurat samme effekten, men i motsatt retning. Personen vil oppsøke nyheter og personer som favoriserer sitt eget synspunkt. Etter samme skyteepisode vil samme personen tolke informasjon i et lys som favoriserer mildere våpenkontroll. F.eks

«Hadde vi hatt mildere våpenkontroll hadde flere personer kunne beskyttet seg selv effektivt, og det vill blitt færre skyteepisoder.»

«Men Martin,» tenker du kanskje, «dette er jo ikke feilaktig – det er jo bare forskjellige meninger?» Jo, det er i for seg sant. Problematikken ligger dog i at de to personene har blitt utsatt for den samme informasjonen, men likevel klart å trekke to vidt forskjellige konklusjoner, ved å velge ut de bitene av informasjonen som best stemmer overens med egne teorier.

Det finnes bedre eksempler; en arbeidsgiver som har fått godt inntrykk av en jobbsøker vil ubevisst lete etter positive elementer i cv’en som støtter inntrykket av at søkeren er en god kandidat. En forelsket person vil lett kunne se de gode sidene hos kjæresten sin, og ubevisst undertrykke de negative sidene. Bekreftelsestendens er også en av journalistens verste fiender. Ved å publisere korrekte fakta, men uten å publisere alle relevante fakta, kan journalister lett gi et misvisende bilde av en situasjon eller nyhet. Det er ikke nødvendigvis slik at journalisten aktivt velger å favorisere en side i en sak, men inntrykket vris for det.

«Personen i bilen hadde drukket en flaske vodka en time før ulykken.»

«Personen i bilen hadde drukket en flaske vodka en time før ulykken på parkeringsplassen der han hadde parkert.»

Det er opplagt at utelatelse av informasjon kan sterkt endre oppfattelsen av situasjonen.

Bekreftelsestendens ser ut til å kunne forklare et par interessante fenomener, blant annet horoskop og ekstrasensorisk persepsjon (ESP). Ta for eksempel beskrivelsen jeg ga av deg, helt i starten av innlegget. Hvordan syntes du den traff? Du er antageligvis skeptisk til å begynne med når du leser det – jeg har jo ingen mulighet til å vite akkurat hvem du er, eller hvordan du er – men sannsynligheten er ganske høy for at du kjente deg igjen i store deler av beskrivelsen. Dette er den såkalte Forer-effekten, som forklarer hvordan personlige horoskop kan oppfattes som spesielt treffende. Poenget er at teksten er skrevet spesielt vagt og generelt; hvem har vel ikke opplevd at de fremstår som mer selvsikre enn de egentlig føler seg? Bekreftelsestendsen slår til igjen!

ESP fungerer tilsvarende. Jeg har en venn som hevder han alltid vet når faren holder på å ringe – han tenker på faren sin – også ringer han! Hvor magisk er ikke det? Dessverre, veldig lite magisk. Bekreftelsestendensen gjør at vi husker de tilfellene hvor vi har opplevd dette – tenkt på pappa rett før han ringer. Men hva med alle gangen man har tenkt på far, og telefonen ikke har ringt? Eller de gangene far har ringt, og man ikke har tenkt på han? Vi har en evne til å sile ut de tilfellene som best passer overens med konklusjonen vår.

Fysikeren Richard Feynman er (blant veldig mye annet) kjent for å ha latterliggjort denne typen posteriori konklusjon,

«You know, the most amazing thing happened to me tonight… I saw a car with the license plate ARW 357. Can you imagine? Of all the millions of license plates in the state, what was the chance that I would see that particular one tonight? Amazing!»

Bekreftelsestendens er en logisk feilslutning. Den gjør oss sårbare fordi det undergraver beslutningsgrunnlaget vårt. Bekreftelsestendens kan enkelt lede til det Nassim Taleb i The Black Swan henviser til som «The Round-trip Fallacy», hvor utelatelse av avkreftelse leder oss til å tro at vi har en bekreftelse, med alvorlige logiske feil. I enkle eksempler kan det være lett å se feilen, men i mer komplekse situasjoner blir det langt verre.

Se for deg at jeg ligger utstrakt på togskinnene mellom Oslo og Trondheim i 5 timer en søndag ettermiddag. Etter fem timer reiser jeg meg og sier, «Se! Jeg ble ikke overkjørt, ergo er det ufarlig å ligge på togskinner». Dette er åpenbart en feilaktig slutning. Bare fordi jeg ikke ble overkjørt i mitt spesifikke utvalg (fem timer på en søndag) kan jeg ikke slutte at togskinner i sin helhet er ufarlige. Det vil faktisk være umulig for meg å bekrefte denne slutningen på denne måten. Dette går tilbake til den vitenskapelige metode – vi kan ikke med sikkerhet bevise at togskinner alltid er ufarlige. Vi kan hypotisere det. Vi kan etter tre dager på togskinnene uten å bli overkjørt anta at det er trygt. Det er først når toget treffer oss en uke senere at vi med sikkerhet kan si at togskinner ikke er trygge å ligge på. Men på dette tidspunktet er det kanskje ikke så relevant lenger.

Poenget er at vi ikke kan bekrefte noe ved å utvide samplet, men vi kan avkrefte ved kun en observasjon. Det kalles ofte negativ empiri.

Om jeg følger en mann på åpen gate i Oslo kan jeg ikke slutte «jeg har ikke sett mannen drepe noen – ergo er han ikke en morder». Jeg kan følge vedkommende i to måneder uten å se han myrde noen, og det vil fremdeles ikke være nok til å si med fullstendig sikkerhet at han ikke er en morder. Det er først når han brutalt knivstikker og dreper meg dagen etter at jeg med sikkerhet kan si at han er en morder (dog en veldig tålmodig en), siden jeg har avkreftet at han ikke er en morder.

Dette kan fort bli vanskeligere i mer kompliserte situasjoner. Ta en titt på de to følgende setningene.

Det foreligger ikke bevis for at dette er en finanskrise. 

Det foreligger bevis for at dette ikke er en finanskrise. 

Setningene er veldig lette å blande, og slutningen vi foretar kan lett blandes. Likevel er de veldig forskjellige.

Hva med de følgende setningene?

Det er ingen bevis på kreft i kroppen.

Det er bevis på ingen kreft i kroppen. 

Det er usannsynlig, dyrt og tidskrevende å sjekke hver celle i kroppen for kreft. Man er dermed nødt til å ta et utvalg, og undersøke dette for kreft. Det er her de to setningene er veldig, veldig forskjellige. Den første setningen sier at det ikke er blitt oppdaget noen kreft, men man har ikke utelukket at det kan være det for det. Den andre sier med fullstendig sikkerhet at det ikke er kreft i kroppen. Setning nummer to tilsier at hver eneste celle er blitt bekreftet fri for kreft.

Ved rask intuisjon er det veldig lett å blande disse to, men dette kan medføre alvorlige logiske brist. Et siste eksempel:

De fleste terrorister er muslimer

De fleste muslimer er terrorister. 

Her burde det være opplagt at setningene betyr to veldig forskjellige ting, og konsekvensen av å blande de to er enorm. Hvis vi antar at den første setningen er sann, at 99% av terrorister er muslimer, betyr dette at omtrent 0.001% av muslimer er terrorister, siden det finnes godt over 1 milliard muslimer i verden, og la oss anta 10.000 terrorister – 1 i 100.000. Så den logiske feilen å blande disse to utsagnene får deg til å overestimere sannsynligheten for at en tilfeldig utvalgt muslim er terrorist med en faktor på nesten 50.000!  Konsekvensen av å blande to ord kan bli at hele folkegrupper, etniske minoriteter og religioner utsettes for diskriminering og stereotyper basert på et helt minimalistisk grunnlag.

For ordens skyld, det blir som å si, «Jeg møtte en nordmann en gang som var drittsekk, så alle nordmenn må være drittsekker.» 

Rent logisk er disse eksemplene forskjellen på implikasjon og ekvivalens; alle A er B, men alle B er ikke A. Om en franskmann er pyroman kan vi ikke anta at alle franskmenn ønsker å brenne ned alt. Det burde være opplagt at det er en feilaktig slutning, men system 1 hopper inn for å redde oss – og lurer oss inn i en falsk sikkerhet.

Narrativ Feilslutning

Mennesker liker historier, vi liker sammenhenger. Hjernene våre jobber konstant for å finne sammenhenger mellom ting for å forenkle verden rundt oss. Hvis jeg ber deg huske nummerrekken «123456789» burde ikke det være noe problem. Det er jo bare hvert tall,  i stigende rekkefølge. Enkelt. Ber jeg deg derimot om å huske «926173845» vil de aller fleste slite betydelig mer. Det er like mange tall, så det burde være tilsvarende like enkelt – men mangelen på en sammenheng og et system gjør at vi sliter.

Vi er rett og slett glad i å komprimere verden rundt oss, ved å bruke huskeregler. Vi er avhengig av disse huskereglene og sammenhengene våre.  Les setningen under.

A BIRD IN THE

THE HAND IS WORTH

TWO IN THE BUSH

La du merke til at det ene ordet er skrevet to ganger? Faktum er at hjernene våre konstant jobber for å rette feil og finne sammenhenger. Dermed kan vi lett la oss lure.

Det er dette som er narrativ feilslutning. Ved å kategorisere verden, og trekke linjer mellom forskjellige situasjoner har vi lett for å la oss lure, og anta ting som mer eller mindre sannsynlig enn det enkel logikk tilsier. Vår systematisering av verden forandrer oppfatningene våre av den.

Vurder eksperimentet gjennomført av Kahneman og Tversky, hvor en rekke statistikere ble bedt om å gjette sannsynligheten for at de to følgende situasjonene oppstår:

  1. En enorm oversvømmelse et sted i Amerika medfører at over 10.000 personer dør.
  2. Et jordskjelv i California medfører store oversvømmelser, som tar livet av mer enn 10.000 personer.

Mange svarte at tilfelle nummer to er langt mer sannsynlig enn det første. Men faktum er at det første tilfellet inkluderer tilfelle nummer to, og mer til. Fordi vi får satt en klar sammenheng, en fortelling og forklaring, regner vi situasjon nummer to som mer sannsynlig – enda det burde være opplagt at dette ikke er tilfellet. Selv drevne statistikere lar seg rive med!

Tilsvarende for de følgende to setningene, hvilken situasjon fremstår som mer sannsynlig?

Kristian var lykkelig gift. Han myrdet kona si.

Kristian var lykkelig gift. Han myrdet kona si for å få arven hennes.

Setning nummer to virker langt mer sannsynlig intuitivt, nettopp fordi mordet begrunnes. En lykkelig gift man myrder ikke kona si uten videre, det er mer forståelig i situasjon nummer to. Men faktum er at setning nummer en inkluderer mord for arven hennes,  mord fordi kona var utro, mord fordi Kristian var gal og mer til – og er dermed langt mer sannsynlig. System 1 tar likevel snarveien, og gjør at intuisjonen vår tar feil.

Når en gjøres klar over hvilken effekt system 1 har på de logiske slutningene våre, er det enkelt å rette sine feil. Den intuitive feilen begåes ofte fremdeles, men om vi benytter resonnert, logisk gjennomgang kan vi lære å se feilene vi gjør. Ihvertfall til man pakker sammen for dagen, og vandrer hjemover.

Denne typen tankegang er veldig domenespesifikk kunnskap – vi benytter den i en fast etablert omgivelse eller situasjon, og ignorerer den ellers.  Evnen til å se og rette logiske feil i klasserommet, er som oftest bedre enn når vi konfronteres med samme feilen i hverdagen. Da har vi en tendens til å kaste fra oss all faglig vekt, og følge instinktet. Som selvfølgelig gjør av vi tar feil, nok en gang. Dette forklarer hvordan selv drevne empirikere og statistikere kan la seg lure i hverdagslige sammenhenger.

Kort oppsummert så er mennesker dårlig egnet statistikk. Biologisk sett er vi bedre på rask respons enn grundig, logisk gjennomgang av teoretiske problem. Og godt er det – hadde vi vært like godt utviklet for dette som impulsiv slutning hadde vi alle vært prehistoriske snacks.

Et kvart århundre med oljefondet

1969 var et år som endret historien. Noen få uker etter at Neil Armstrong ble den første mannen til å sette sine føtter på månens overflate, oppdaget Phillips Petroleum det største oljefeltet funnet til havs – Ekofisk. Omtrent 70 meter under Nordsjøens overflate lå en oljeformue og ventet på å bli hentet opp.

Det norske oljeeventyret var igang.

En oljeformue under havet har uten tvil kommet innbyggerne i Norge til gode. År etter år topper Norge indekser for sosial utvikling, beste land å bo i, rikeste land og mer til. Men det var ikke alltid gitt at oljen kom til å være en positiv påvirkning.

Hollandsk syke er et begrep alle norske økonomer kjenner til. Det beskriver den økonomiske krisen Nederland sto ovenfor mot slutten av 70-tallet, som følge av landets enorme inntekter fra naturgass. Bare 10 år før Ekofisk ble oppdaget i Nordsjøen, ble det oppdaget store gassfelt i havområdet utenfor Nederland. Gassindustrien ble bygget enormt opp, og ga store inntekter for landet. Optimisme i landets fremtid trakk investorer – alle ville ta del i det nederlandske gasseventyret.

Med stor etterspørsel etter den nederlandske myntenheten gylden, styrket valutaen seg enormt. Nederlandske innbyggere nøt godt av billig utenlandshandel, og importen steg til værs. I mellomtiden slet eksportnæringene. Med en sterk valuta fikk eksportnæringene mye færre gylden for lik utenlandsk pris – konkurranseevnen deres ble kraftig svekket. For store deler av eksportnæringen ble det uutholdelig – og mange bedrifter gikk konkurs og ble lagt ned.

Stor nedgang i eksportnæringen medførte et kraftig etterspørselssjokk i den nederlandske økonomien. Nedgangen i etterspørsel i industrien sank så kraftig at den totale etterspørselen i samfunnet ble påvirket. Lavere etterspørsel tilsier lavere inflasjon og lavere aktivitet. Produksjonen faller, behovet for arbeidskraft synker og arbeidsledigheten stiger. Høy ledighet medfører lavere lønninger – bedriftene trenger ikke lenger å kjempe om de ansatte. Og med lavere lønninger følger lavere forbruk, og enda lavere etterspørsel.

Den tradisjonelle kuren på et etterspørselssjokk er statlig intervenering. Når staten åpner pengeboka og begynner å bruke, stimulerer dette aktiviteten. Store statlige prosjekter ansetter tusenvis, gir lavere ledighet og drar etterspørselen igang igjen.

Men! tenker du kanskje, Om den Nederlandske gassindustrien var i full sving, ville ikke det motvirke nedgangen i økonomien?

Dessverre. Det er klart gassindustrien økte behovet for arbeid, med sett i sammenheng med nedgangen i eksportnæringene var det for lite. Gassindustrien var en for kapitalintensiv industri – det var mye bruk av maskiner og mindre bruk av arbeidskraft.

Kronen på verket ble det nederlandske velferdssystemet. Med store gassinntekter satte staten igang med å konstruere en av de mest omfattende velferdsordningene i noe land – på mange måter lik den vi nyter godt av i Norge idag. Arbeidsledighetstrygd, pensjonsordninger og mer til medførte stadig større offentlig del av økonomien. Kombinert med de offentlige utgiftene for å dra igang etterspørselssiden sto staten for over 60% av konsumet i økonomien i tidlig 1980! Til sammenligning utgjør den offentlig sektor rundt 20% av BNP i Norge idag – et tall mange økonomer mener begynner å bli faretruende høyt.

Nederland ble truffet hardt når inntektene fra gassindustrien omsider sank. De hovedsakelige delene av økonomien baserte seg på nettopp dette – gassindustrien matet beistet som offentlig sektor hadde blitt. Siden eksportnæringene for lengst hadde pakket sammen fantes det lite annen industri igjen i landet som aktiviteten kunne veltes over på. Nederland var blitt for avhengig av gassinntektene – og gassinntektene var ikke lenger samarbeidsvillige. Resultatet ble en lang og smertefull omstilling av den nederlandske økonomien.

På mange måter kan vi være takknemlige for at Nederland kom oss i forkjøpet. Hollandsk syke utgjorde et skrekkeksempel for norske politikere når inntektene fra våre egne olje- og gassfelt begynte å trille inn. I 1974 la Finansdepartementet frem Stortingsmelding nr. 25, «Petroleumsvirksomhetens plass i det norske samfunn», der de på 97 sider redegjorde for utfordringene og potensialet som lå i norsk olje- og gassvirksomhet. I meldingen trekkes det fram alt fra direkte beskatningsmuligheter, miljøhensyn og geopolitiske utfordringer til forslag om opprettelsen av Norsk Undervannsinstitutt. Men tidlig i meldingen advares det mot et scenario lik det Nederland opplevde:

Petroleumsfunnnene i Nordsjøen gjør at vi som nasjon, blir rikere. Regjeringen mener at en i første rekke må benytte de nye muligheter til å utvikle et kvalitativt bedre samfunn. En bør unngå at resultatet bare blir en rask og ukontrollert vekst i bruken av materielle ressurser uten at samfunnet ellers blir vesentlig endret.

Stortingsmeldingen utgjør ganske interessant lesing sett i retrospektiv. Den ligger tilgjengelig på nettet her.

5. mars 1982 oppnevnte regjeringen et utvalg for å utrede «alle forhold som er av særlig betydning for vurderingen av den framtidige utviklingen av petroleumsvirksomheten.» Dette medførte den offentlige utredningen NOU 1983:27 «Petroleumsvirksomhetens fremtid», senere ofte omtalt som Tempoutvalget. Utvalget skulle vurdere med hvilken hastighet oljereservoarene burde tappes, og i hvilken grad oljeformuen kunne benyttes. De foreslo for første gang opprettelsen av et petroleumsfond for langsiktig sparing og forvaltning av oljeformuen. Det er vanskelig å ikke smile når man leser gjennom disse dokumentene, for selvom et petroleumsfond ble foreslått som et alternativ, anså utvalget det selv som lite sannsynlig:

Ut fra de holdninger vi kjenner både i det politiske miljø og generelt i befolkningen, er det vanskelig å tenke seg at hundretalls av milliarder blir plassert som fordringer i utlandet, samtidig som en står overfor udekkede behov innenlands, og kanskje også sviktende sysselsetting som nære og påtrengende problemer.

Det er dermed et testament til politikernes visjoner at Statens Petroleumsfond ble vedtatt etablert av Stortinget, fredag 22. juni 1990. Grunnet underskudd på statsbudsjettene i 1990-1995 ble ikke første innskudd til fondet gjennomført før i 1996, da det ble overført 46 milliarder kroner.

Statens Petroleumsfond byttet i 2006 navn til Statens Pensjonsfond Utland, idag populært kalt oljefondet. Per dags dato forvalter fondet over 1% av alle verdens aksjer, og har en verdi på nesten 7000 milliarder kroner – nærme 1.4 millioner kroner per nordmann. Takket være (stort sett) politisk konsensus om langsiktig planlegging, er oljefondet blitt et viktig finanspolitisk virkemiddel som gir Norge  stort økonomisk handlingsrom. 

Dagen idag markerer at det er 25 år siden Statens Petroleumsfond ble opprettet – og det norske finanseventyret startet. 

Gratulerer med dagen, folkens!

partyplattform