Hvit løgn, sort løgn og statistikk

krf går mest frem måling abcnyheter  tv2

Så, Opinion har kommet med en ny meningsmåling på oppdrag av Avisenes Nyhetsbyrå (ANB), og de store nyhetene er at KRF raser avgårde med 1.9% økning mens MDG faller med 1.6%, og ligger dermed under sperregrensa.

Problemet er bare at…

tallenes tale

… tallene baserer seg på 962 telefonintervjuer, hvorav bare 74% har avgitt svar. Det vil si at de har 712 person som har fortalt hvor de står.

I 2015 var det såvidt over 4 millioner stemmeberettigede personer i Norge (4.016.624 ifølge SSB). Det vil si at Opinion har forhørt seg med 0.01% av befolking.

Nå er det greit nok å ikke forhøre seg med hele befolkningen, det kan vi heller ikke forvente. Meningsmålinger fungerer nettopp ved at man finner et representativt utvalg av den totale populasjonen og estimerer de faktiske andelene basert på dette. Dersom man trekker helt tilfeldig fra populasjonen vil fordelingen av utvalget etterhvert gå mot den faktiske fordelingen etterhvert som man har flere og flere observasjoner.

Det som er kritisk å ha i bakhodet da er at desto flere observasjoner man har desto nøyaktigere vil estimatet bli, og motsatt. Så når man har et lite utvalg vil usikkerheten i estimatene bli forholdsvis stor. Dette er det vi kjenner som feilmarginen.

Feilmarginen vil variere avhengig av partistørrelse. Dersom partiet er lite, og vi har få observasjoner, vil det naturligvis være en større feilmargin enn dersom partiet er større og vi har like mange observasjoner.

Opinion oppgir sin feilmargin som «mellom 1 og 3 prosent avhengig av partistørrelse.»

Hvis vi ser på tallene igjen, relativt til partistørrelsen, finner vi som følger.

KRF er et relativt lite parti, og har ligget på rundt 5%. Med en feilmargin på 1-3% kan vi dermed ikke vurdere en endring på 1.9% som statistisk signifikant. For alt vi vet står de dønn stille på meningsmålingene. 

MDG er et enda mindre parti. Dermed sier det seg selv at 1.6% endring heller ikke er signifikant. 

Hva med de andre partiene?

Foruten om Høyre ligger alle andre parti på under 1% endring. Det er mindre enn selv den best estimerte feilmarginen på 1%. Høyre har en nedgang på 1.3%, men selv her kan vi i beste fall (sånn rent statistisk sett, ikke nødvendigvis politisk) peke på en nedgang på 0.3%.

Det betyr at avisartikkelene like greit kan være:

kanskjekrf måling abcnyheter ny

tv2ny

There are three kinds of lies: lies, damned lies, and statistics,

-Benjamin Disraeli

Kom igjen ‘a.

Hvor lenge kan du holde igjen bussen?

Okai, så klokka har nettopp bikket over tre på ettermiddagen. Du vet at du ikke egentlig burde reise fra lesesalen før den har passert fire, men samtidig er det ikke som du kommer til å få gjort noe mer arbeid idag. Så du pakker sekken og vandrer avgårde mot bussen. Så skjer det som alltid skjer. Det skjebnesvangre øyeblikket i det du går ut hovedinngangen og ser at bussen står på holdeplassen nede ved veien. Skal du løpe og veive vilt med armene i et håp om at sjaføren leser din gestikulerte bønn og venter, eller vandre sakte og rolig ettersom at du uansett ikke kommer til å rekke den?

Løsningen for mange av studentene ved NTNU Dragvoll ser ut til å bestå av å komme seg fortest mulig ned til veien og foran bussen slik at den ikke kan kjøre. Det har seg nemlig slik at fotgjengerovergangen fra hovedinngangen er plassert omtrent 20m foran bussholdeplassen.  En effektiv løsning, om dog en noe frustrerende en. Hvor lenge kan du legitimt forsinke bussen på denne måten?

Her kan det fort bli aktuelt å se på køprising. Køprising er et tema som er hyppig oppe i den offentlige debatten. Debatten omhandler at kø er en byrde som påfører alle brukere av veien en kostnad. Tanken ved køprising er å tvinge brukerne av veien til å betale for den kostnaden de er med på å påføre alle andre brukerne av veien. Men før man kan fastsette dette beløpet er man nødt til å kunne beregne den faktiske kostnaden av å stå i kø. Så hvordan gjør man det?

Den enkleste måten å tenke på køprising er at kostnaden er lik den tapte verdiskapning som følge av køen. Alle ingeniørene som sitter i trafikk kunne istedet sittet på kontoret og skapt verdier. Hvis 20 personer med 200 kroner timelønn blir sittende i kø i en time har man altså tapt 20*200 = 4000 kroner på en times kø . Dette er dermed en måte å beregne både gevinst og kostnad ved veier. Om man bygger en sikrere motorvei som tillater en økning i fartsgrensen fra 70km/t til 90km/t vil hver bruker av den nye veien spare tid ved at de kommer raskere frem. Over hundretusenvis eller millioner av personer som reiser på veien, over ti-talls år, blir denne effekten veldig fort veldig vesentlig. Derfor er oppgradering av veier og lignende transport-infrastruktur ofte høyt prioriterte offentlige prosjekt.

Dette betyr også at forsinkelser på bussen medfører en kostnad for alle brukerne av bussen. Om jeg for eksempel kommer løpende og holder igjen bussen i ti sekunder tenker jeg ikke så mye over det – men effekten må summeres opp over alle de andre i bussen. De vanlige AtB-bussene i Trondheim har en standard kapasitet på 49 sitteplasser, og omtrent tilsvarende like ståplasser. Nå er det mange busser som kjører i Trondheimsområdet, og mens noen er stappfulle (virker hvertfall sånn hver gang jeg hopper på bussen) er det også tilsvarende mange som er tilnærmet tomme. Dermed kan vi ta utgangspunkt i en halvfull buss, på omtrent 50 personer.

Det vil si at om jeg kommer løpende fra lesesalen og holder igjen bussen med ti sekunder er det i praksis 500 sekunder som går tapt bare for at jeg skal rekke den bussen. Det betyr at for at det skal være en positiv nettoeffekt må det at jeg holder bussen i ti sekunder resultere i en gevinst på 500 eller mer sekunder for min del – noe som godt kan tenkes om det er femten minutter mellom hver buss som går. (Det kreves og at jeg er fullstendig effektiv med tiden min når jeg ikke er på bussen. Som om).

Det er dermed interessant å ta en vurdering på hvor lenge man kan holde igjen bussen for at det skal kunne fremdeles ha en nettoeffekt.

Vi legger til grunn noen forutsetninger:

  1. Når jeg nå regner tapt tid regner jeg kun i den tapte tiden for de personene som allerede sitter ombord i bussen. Den tar ikke hensyn til  alle som er down-stream – det vil si de som står og venter på bussen om 3, 4 og 5 stopp. Dette er et vanskeligere hensyn å ta. For det første vil en forsinkelse påvirke dem forskjellige med tanke på hvor langt de skal reise totalt, og det er vanskelig å si at reisetiden er den samme uansett. Kanskje vil sjaføren bli stressa om jeg holder den igjen, og dermed kjøre raskere. Kanskje han unngår, eller blir fanget i, en kø han ellers ikke hadde blitt påvirket av. Jeg er lat og ignorerer dette. Jeg vurderer det som at bussen er allerede halvfull i det jeg går på – og at alle skal reise minst like langt som jeg skal.
  2. Sjaføren kjører helt identisk uansett av hvor forsinket han blir;  vi antar en fullstendig uniform reisetid uansett tidspunkt man reiser på.
  3. Alle er perfekt effektiv i alternativ anvendelse av tiden deres. Hvis dette ikke holder må man plutselig begynne å begrunne om to minutter spart for meg tilsvarer den samme nytten som du nyter av to minutter. Det blir fort vanskelig.

Okai, så tilbake til problemet. Hvor lenge kan jeg holde igjen bussen for at det fremdeles skal være en nettogevinst? Svaret på dette vil åpenbart avhenge av hvor mange personer som sitter på bussen. Er du den eneste kan du teoretisk sett holde igjen bussen i et kvarter – etter dette kan du jo like greit ta neste buss. Sjaføren kjører jo uansett, og vi ser bort ifra andre passassjerer som reiser fra et senere stopp. Dermed vil det eneste aggregerte tapet være det som du selv påføres ved å holde igjen bussen.

For hver ekstra person som sitter på bussen må nettoverdien av min tidsgevinst fremdeles veie opp for økning i tapt verdiskapning. Det vil si at fortjenesten (de minuttene jeg slipper å benytte på å vente på neste buss) må overstige den aggregerte effekten av alle som er ombord (igjen, forutsatt perfekt alternativ anvendelse av tiden.) Det vil si at om vi forventer at alle busser kommer presist hvert 15. minutt (nok en usannsynlig antagelse) kan vi se på det som at min mulighet til å holde igjen bussen sparer meg for 900 sekunder ventetid på neste buss.

Om vi går utifra at det er 50 personer i bussen, og at det er 900 sekunder til neste buss, kan jeg altså legitimt begrunne å holde bussen igjen i 18 sekunder. Holder jeg bussen i mer enn dette øker kostnaden for alle andre ombord i  bussen mer enn tidsgevinsten min gjør, og vice versa. Holder jeg bussen i ti sekunder sparer jeg 900 sekunder på en 500 sekunders bekostning for de ombord, og nettogevinst er altså positiv; 400 sekunder. Holder jeg bussen i 20, sparer jeg 900 sekunder på bekostning av 1000 sekunder. Jeg koster dermed andre mer tid enn jeg tjener inn selv.

Men det er jo ikke alltid at bussen er full. Dermed kan vi få den følgende grafen for alternative scenarioer; fra tom til full buss:

Forsinkelse

Vi finner dermed at dersom det kun er ti personer på bussen kan du holde den igjen i opptil 90 sekunder med god samvittighet. Er bussen stappfull kan du fremdeles holde den i 9 sekunder for å oppnå nøytral gevinst, altså at din gevinst perfekt veier opp bussens kollektive tap.

Dette er ikke nødvendigvis resultatet jeg ønsket å finne, men data er data. Det er dog verdt å nevne at om man skal være mer realistisk og inkludere alle som står på senere stopp, blir det opplagt at forsinkelseskvoten blir betydelig mindre. Vi kan regne med at bussen tømmes og fylles fullstendig minst en gang iløpet av en hel tur – og dermed har vi i realiteten at kvoten kan være nede i 4.5 sekund ved stappfull buss.

Det er også sånn at dersom vi regner tapt verdiskapning er ikke alles tid like mye verdt. Om det sitter en konsulent med mange hundre kroner i timelønn, vil det tapet som påføres være større enn gevinsten en student oppnår. Studenter har jo betydelig lavere implisitt timelønn.

… Men hva er egentlig timelønnen til en student?