Forstår verden med moderne statistikk

        Enkle, statistiske undersøkelser har reddet kvinner fra å dø i barsel og babyer fra krybbedød. Nå kan moderne, statistiske metoder gjøre det mulig å bedre kreftbehandlingen, avsløre skattesvindlere og forstå krigens dynamikk.

STATISTIKK: - Statistikk er vitenskapen som gjør det mulig å ta beslutninger selv om datagrunnlaget består av usikkerheter, poengterer professor Nils Lid Hjort på Matematisk institutt. Foto: Colourbox.

Statistikere har tatt i bruk helt nye metoder for å løse viktige oppgaver for både deg og resten av samfunnet.

Statistikk kan brukes til mye, som alt fra fredsforskning og persontilpasset kreftbehandling til hvordan det er mulig å avsløre skattesnusk og hvordan rederiene kan spare millioner av kroner på å drifte de store tankbåtene på verdenshavene.

– Felles for disse forskningsprosjektene er at vi må løse statistiske problemstillinger fra svært store og til dels uoversiktlige datamengder. Det er nettopp det som er den store utfordringen for oss statistikere i dag. Statistikk er vitenskapen som gjør det mulig å ta beslutninger selv om datagrunnlaget består av usikkerheter. Vi bruker statistikk for å finne kunnskap om hvordan verden virkelig er, poengterer Nils Lid Hjort, professor i statistikk på Matematisk institutt ved Universitetet i Oslo.

Reddet kvinner i barsel

Før i tiden var alt mye enklere. Da holdt det å forholde seg til små datamengder.

Et livreddende eksempel med svært enkel statistikk var da den ungarsk-østerrikske legen Ignaz Semmelweis i 1847 reagerte på de høye  dødelighetstallene blant fødende kvinner på et sykehus i Wien.

Dødeligheten på avdelingen til Semmelweis var mye høyere enn på de andre avdelingene ved sykehuset. På avdelingen hans døde én av åtte kvinner. Legene obduserte også lik. På den andre avdelingen rådet jordmødrene. Der døde én av femti kvinner.

Dødsraten sank dramatisk da Semmelweis, ved å sammenligne tallene, slo fast at færre kvinner døde i barsel hvis sykehuslegene vasket hendene grundig etter hver obduksjon.

– Den gangen kjente ingen til bakterier. Forklaringen på de mange dødsfallene kom først flere tiår senere. I dag er det opplagt at legene må vaske hendene etter en obduksjon. Statistisk fantes det et mønster, selv om legene der og da ikke hadde den medisinske forklaringen på hvorfor dette var riktig, forteller Nils Lid Hjort.

Reduserte krybbedød

KRYBBEDØD: Takket være statistiske analyser kunne krybbedødforskere på begynnelsen av nittitallet slå fast at det var lurt å legge babyer på ryggen. Foto: Colourbox

Over hundre år senere ble statistikk brukt i krybbedødforskning. Mange babyer døde uforklarlig og plutselig. Den australske barnelegen Susan Beal og den nederlandske legen Guus A. de Jonge fattet mistanke om at dødsfallene kunne skyldes liggestillingen. Dette var på 1970- og 80-tallet, da mageleie ble ansett som den optimale sovestillingen.

– Krybbedødepidemien kulminerte i Norge i 1989. Da døde 142 barn i krybbedød, forteller Torleiv Ole Rognum. Han er professor emeritus på avdeling for rettsmedisinske fag ved Universitetet i Oslo og fikk sommeren 2018 en internasjonal pris for sitt omfattende arbeid mot krybbedød.

Det store spørsmålet var om babyene skulle sove på magen eller ryggen. Medisinerne satte i gang kontrollerte, statistiske studier for å finne ut om det fantes en sammenheng mellom liggestilling og dødsfall.

I 1990, før sammenhengen var endelig bevist, ble det på et stort internasjonalt møte om krybbedød i Trondheim anbefalt at spedbarn skulle ligge på ryggen. To år senere, i 1992, ble sammenhengen statistisk bevist.

– Virkningen var dramatisk. Krybbedødtallene falt og har fortsatt å falle. I dag er det rundt ti årlige tilfeller, poengterer Torleiv Ole Rognum.

Dataeksplosjon

Siden den gang har datamengdene eksplodert.

– Den voldsomme datafangsten har endret statistikkfaget, sier Nils Lid Hjort.

Noen tror kanskje at de enorme datamengdene gjør det lettere for statistikere. Da tar de grundig feil.

– Vi leter etter nålen i høystakken. Jo større høystakken er, desto vanskeligere er det å finne nålen. Dessuten er det fare for å finne ting som ligner på nåler, men som ikke er det likevel.

Mange samler inn data uten å stille seg klare spørsmål om hva de ønsker å finne svaret på. Det er et stort problem.

– Med en ugjennomtenkt innsamling av data kan de klassiske, statistiske metodene bli ugyldige.

Statistikerne må derfor utvikle og tilpasse metodene sine for å kunne holde tritt med de enorme datamengdene som har kommet til de siste årene.

– Ethvert fag med komplekse problemstillinger vil trenge statistikk på høyt nivå. Selv om statistikkfaget er hundre år gammelt og mye fundamentalt er forstått, er det mer enn nok problemstillinger igjen. Det skyldes ikke bare at datafangsten er større enn før, men også at dataene er blitt langt mer komplekse, påpeker Nils Lid Hjort.

Postdoktor Céline Cunen på Matematisk institutt har forsket på hvordan statistikk kan brukes til å si noe om hvorvidt verden er blitt fredeligere, noe du kan lese mer om i denne temautgaven. Hun poengterer at statistikere nå må lete etter mye svakere signaler i datamaterialet enn tidligere. Da er det vanskeligere å skille mellom datastøy og reelle funn.

Mange data blir dessuten samlet inn av ulike instanser. Mye av informasjonen er rotete.

– Problemet er at jo større datamengdene blir og jo mer uryddig de er lagret, desto vanskeligere er det å dra nytte av dem. En viktig del av statistikkfaget er å bidra til å samle  inn de mest relevante dataene, sier Céline Cunen.

Etisk ansvar

Selv om statistikk er et nødvendig verktøy for å forstå verden, brukes det ofte uvettig.

– Statistikk kan misbrukes. Det følger derfor med et etisk ansvar. Noen statistikere tenker ikke alltid på menneskehetens beste, beklager Nils Lid Hjort.

Et eksempel er statistikerne som jobber med de moderne overvåkingssystemene i Kina. Overvåkingen premierer folk med god oppførsel og gjør det vanskeligere for dem som ikke følger systemet.

– Her brukes avansert statistikk og komplekse algoritmer, med mulige konsekvenser for millioner av borgere. Jeg mener dette kan lede til misbruk.

Et annet misbruk er når statistikk brukes til å påvirke et valgresultat. Det amerikanske firmaet Cambridge Analytica fikk med tvilsomme metoder tak i data fra flere millioner Facebook brukere. Flere amerikanske politikere, som Donald Trump og valgkamporganisasjonen hans, tilpasset det politiske budskapet ved å analysere brukernes atferd på Facebook.

Statistikerne ved UiO ønsker derimot å bruke anvendt statistikk til «menneskehetens beste».

– Karl Marx sa i 1845 at filosofene bare brydde seg om å forstå verden. Vi vil med marxistisk forstand også bruke statistikk til å forandre verden – til det bedre, poengterer Nils Lid Hjort.

Statistikerne beklager også at faget blir misbrukt av enkelte forskere. De leter for mye etter mulige funn. Roter de lenge nok i høystakken, vil de finne ting som ser ut som nåler, selv om svarene ikke er statistisk gyldige.

– Problemet er at noen forskere ikke forstår de grunnleggende tingene ved komplekse, statistiske metoder og legger frem tilsynelatende signifikante funn, som egentlig bare er «støy». De fleste gjør dette i god tro, men noen gjør det også med vilje, påpeker Céline Cunen.

 

Av Yngve Vogt
Publisert 28. jan. 2019 09:27 - Sist endret 28. jan. 2019 09:27
Legg til kommentar

Logg inn for å kommentere

Ikke UiO- eller Feide-bruker?
Opprett en WebID-bruker for å kommentere