Tvilsomme tall

Et tallmateriale blir ofte vurdert som om det gir et objektivt svar på kompliserte problemer. Statistiker Erik Bølviken advarer oss mot å stole for mye på tallfestet informasjon.

To grafer som illustrerer det samme forholdet i et tallmateriale. Forskjellige inndelinger på aksene gir likevel et ulikt visuelt inntrykk. Med kortere inndeling mellom enhetene på den nederste aksen får grafen en sterkere stigning. (Ill: Arnt Sommerlund)

Det er galt å si at tall ikke lyver, sier professor Bølviken ved Avdeling for statistikk og forsikringsmatematikk ved Matematisk institutt. Han poengterer at det er viktig å analysere kritisk hva tallene egentlig sier og hva som ligger bak dem.

Tall er ikke objektive sannheter, og svakhetene ved et tallmateriale er lett å skjule. Såkalte fakta blir ikke nødvendigvis så mye mer å stole på hvis de er behandlet av en datamaskin. Hvis tallene i utgangspunktet er usikre, kommer vi ikke nærmere sannheten ved å regne på dem, sier Bølviken. Han påpeker at det er en tendens til å tallfeste ting som ikke burde kvantifiseres.

Det er umulig å sette et objektivt kronebeløp på for eksempel forurensning. Det å iberegne miljøproblemer i et brutto nasjonalprodukt, er derfor lite hensiktsmessig.

Dette kan illustreres ved å se på hvordan verdien av miljøforurensning kan beregnes: Skal man se på hvor mye lokalbefolkningen er villig til å betale for å få en elv renset, eller skal man se på hvor mye det anslagsvis ville koste å rense elven?

Fokus på det usannsynlige

Bølviken advarer oss mot å velge ut en bestemt hendelse hvor det usannsynlige eller overraskende skjer blant mange andre tilsvarende hendelser. I løpet av et langt liv opplever vi mye uforutsigbart, men at en bestemt usannsynlig hendelse skal inntreffe i morgen, er lite sannsynlig.

Ser man kun på den ene hendelsen hvor det usannsynlige skjer, er det merkelig at det skjer akkurat da, men det er likevel så mange andre hendelser hvor det usannsynlige ikke skjer, sier Bølviken. Han mener at denne seleksjonseffekten er den mest typiske fallgruven ved tolkning av tallfestet informasjon.

Det usannsynlige skjer hver dag. Når jeg treffer en gammel venn på gaten som jeg ikke har sett på 20 år, er det i og for seg usannsynlig, men denne hendelsen har hatt så mange sjanser. At jeg i løpet av en lengre periode skal treffe en av mine gamle venner som jeg ikke har sett på flere år, er jo svært sannsynlig.

Bølviken trekker også fram et eksempel fra et sykehus hvor det var tre tilfeller av misdannelser ved fødsler i løpet av ett år. I forhold til det normale, som var ett tilfelle pr. fjerde år, var det 0,03 prosent risiko for at dette skulle inntreffe. Mistanken om at det var noe galt på dette sykehuset, var dermed sådd.

Når vi trakk inn flere sykehus, som teoretisk sett hadde den samme normalen, var det hele femten prosent sjanse for at ett av femti sykehus ville få et så høyt tall som tre tilfeller per år, sier Bølviken.

Ved de statistiske beregningene i forbindelse med de uvanlig mange dødsfallene ved Landås sykehjem i Bergen i år, har man tatt hensyn til det samme: Det usannsynlige inntreffer hvis man plukker ut en spesiell hendelse fra alle de normale.

Det er viktig ikke å overfortolke når de lite sannsynlige hendelsene inntreffer, sier Bølviken.

Kjappe konklusjoner

Verden er ikke alltid like enkel som den kan synes ved første øyekast. Grunnen til at noe skjer, er ofte vanskelig å få tak i. Hvis man glemmer eller velger å se bort fra underliggende faktorer, kan vi bli lurt av tall og statistikk. Aftenposten kunne 2. september i år fortelle sine lesere følgende:

«Tap av ektefelle eller skilsmisse betyr fire år mindre levetid for kvinner, mens menn dør åtte år tidligere dersom de opplever slikt.»

Forklaringen på den store forskjellen i levetid ligger sannsynligvis i at folk som skiller seg, har en annen livsstil enn folk som ikke gjør det, kommenterer Bølviken.

Det er ikke en direkte sammenheng mellom skilsmisse og levetid, men en annen livsstil er den underliggende faktoren. Det vil si at det antakeligvis er en sammenheng mellom skilsmisse og en utsvevende livsstil. Det er selvfølgelig ikke slik at du som mann løper en direkte risiko for å dø åtte år tidligere hvis du skiller deg.

Damene som forsvant

En tredje faktor som kan gi feil informasjon, er når tallene vi bruker, ikke er representative. Bølviken nevner som eksempel de tidligere politiske meningsmålingene.

Da disse ble gjennomført ved at man spurte ved dørene til folk, var det en klar tendens til at Kristelig Folkeparti fikk mindre oppslutning på meningsmålingene enn ved de virkelige valgene. Denne tendensen førte til at partiets tall ble oppjustert i disse målingene, forteller han.

Det ble antatt at denne skjevheten i målingene skyldtes at det var et forholdsvis stort antall eldre damer som ikke ville åpne opp når en fremmed mann ringte på.

Ved bruk av telefon er det mulig å komme nærmere idealet om representative tall i slike undersøkelser, påpeker han.

Valg av kriterium

Illustrasjonsfoto

I politiske debatter blir tallmateriale ofte brukt til å argumentere for et bestemt syn på en sak. Ved å velge ut de riktige tallene kan tall virke som et udiskutabelt argument i diskusjonen. Men tallene må ikke ukritisk betraktes som beviser. (Foto: Rune Petter Ness/NTB)

Hva som blir definert som utslagsgivende og viktig i en sak, kan være kilden til varierende tallmateriale.

Å se på antall syke som er behandlet, kan gi et helt annet inntrykk enn å se på hvor mange som står i sykehuskø, sier Bølviken.

Hva som er relevant, blir som oftest avgjort av hvilke subjektive standpunkter man vil framheve. Det er vanskelig å tilbakevise tallmateriale, men tallene må ikke nødvendigvis bli sett på som objektive sannheter, som beviser at den ene parten i en politisk debatt har monopol på sannheten.

Grafisk manipulasjon

Bølviken nevner manipulasjon med grafikk, som den siste av fem store fallgruver ved bruk av tallfestet informasjon.

Det er viktig å se på hvordan inndelingen på de to aksene er satt i forhold til hverandre, sier Bølviken. Han tror likevel at mye av denne manipulasjonen skjer ubevisst.

Jeg er mest opptatt av de ærlige feilene ved bruk av tall, de som skyldes uvitenhet, ikke den bevisste triksingen med statistikk for å lure folk.

Emneord: Statistikk, Matematikk, Matematikk og naturvitenskap Av Øystein L. Pedersen
Publisert 1. feb. 2012 12:21
Legg til kommentar

Logg inn for å kommentere

Ikke UiO- eller Feide-bruker?
Opprett en WebID-bruker for å kommentere