Moderne kreftdiagnose skjer på datamaskinen

Den moderne kreftbehandlingen er blitt flyttet fra laboratoriet til datamaskinen. For å finne genendringene som fører til kreft, må det kjøres enorme beregninger på en av verdens raskeste tungregnemaskiner.

ENORME BEREGNINGER: Eivind Hovig har utviklet et helt nytt system som gjør det mulig for kreftforskere over hele verden å analysere og sammenligne DNAsekvenser. Beregningene er så tunge at de må kjøres på tungregnemaskinen på UiO. Foto: Yngve Vogt

Alle kreftceller har genetiske forandringer. Det  kan være mange hundre av dem. Noen forandringer er vanlige, andre sjeldne. Den spesielle kombinasjonen av mange forandringer kan være unik for en kreftsvulst.


Ny sekvenseringsteknikk har gjort det mulig å kartlegge alle de genetiske forandringene i en svulst. Sekvenseringsmaskinen klarer ikke å lese hele genomet på en gang.

Løsningen er å kutte genomet i småbiter og lese en og en blokk. Så må alle blokkene settes sammen i riktig rekkefølge.


Teknikken er foreløpig ikke feilfri. For at gensekvenseringen skal bli mest mulig presis, er det nødvendig å sekvensere det samme stykket opp mot hundre ganger. Med tanke på at DNA-strengen vår består av over tre milliarder basepar, kreves det enormt med diskplass for å lagre geninformasjonen fra en enkelt svulst.


– For å finne de forandringene som er knyttet til kreft, må vi sammenligne pasientens normale DNA med det som finnes i svulsten og med oppslag i mange forskjellige internasjonale databaser, forteller professor Eivind Hovig, som er tilknyttet både Institutt for kreftforskning på Radiumhospitalet og forskergruppen for biomedisinsk informatikk på Institutt for informatikk ved Universitetet i Oslo. Han er en av landets ledende bioinformatikere og har et tett samarbeid med professor Ola Myklebost, leder for kreftgenomikk-prosjektet.


Ingen programkode.

Det er ikke bare DNA-sekvensen som blir forandret i kreftsvulsten.  Også organiseringen av arvematerialet kan være annerledes. For å analysere dette kreves både enorme mengder lagringsplass og regnekraft.


Nå har Eivind Hovig, sammen med første-amanuensis Geir Kjetil Sandve og stipendiat Sveinung Gundersen, utviklet et webbasert system for storskala-analyse av DNA som gjør det mulig for alle kreftforskere – over hele verden – å tolke denne typen data på tungregnemaskinen ved UiO uten å måtte programmere en eneste linje.


Det webbaserte systemet kalles «the Genomic HyperBrowser». De ferdigprogrammerte statistikkmodulene er utviklet ved UiO og Norsk Regnesentral.


– Ettersom systemet vårt er direkte koblet med dataanleggene på UiO, kan vi få tilnærmet sanntidsberegninger for utrolig krevende prosesser. Sanntidsberegninger betyr at beregningene skjer her og nå. Programmet er til selvhjelp for biologer og medisinere som ikke kan mye programmering. Programmeringen er løst én gang for alle. Her kan forskere raskt få svar på problemer som de ellers hadde brukt mye tid og ressurser på å løse selv. Ettersom alle resultatene er dokumenterbare og ettersporbare, vil fagfeltet kunne gå langt raskere fremover, poengterer Hovig.



Internasjonal standard.

Programmet bygger på en eksisterende plattform kalt Galaxy.

– Det er et funksjonelt rammeverk med mange ferdigprogrammerte funksjoner og har et webgrensesnitt som gjør det mulig å holde orden på og sammenligne gamle og nye kjøringer.

Galaxy holder med andre ord orden på alle svar og gir en oversikt over alle forsøk som er gjort.


– Da kan forskere over hele verden reprodusere resultatene som andre forskere har kommet frem til.


750 000 kombinasjoner.

Forskergruppen har også utviklet flere måter å visualisere resultatene i The Genomic HyperBrowser.


I den analysen som Hovig demonstrerer for Apollon, viser han frem et kombinasjonskart med 3000 sykdommer og 250 transkripsjonsfaktorer. For hver av de tre kvart million mulige kombinasjonene, er det mulig å klikke på en statistisk analyse som inneholder alle underliggende data.


– Hvis det er en sirkel i firkanten, er kombinasjonen mellom sykdom og transkripsjonsfaktor statistisk signifikant. Vi kan da se hvilke elementer som bidrar til sykdommen. Dette er altså en metode for raskt å lete etter avvik i store datamengder.

 

Tredimensjonalt.

Forskergruppen har også pub-lisert nye metoder for statistisk analyse i organi-seringen av DNA i tre dimensjoner.
 

– Arvestoffet er som oftest organisert som en slags garnnøster, men det er ikke tilfeldig hvilke områder som ligger i nærheten av hverandre. Dette kan ha betydning for hvorfor ulike celletyper oppfører seg ulikt, forteller Eivind Hovig. 

 

DNA-analysen: hyperbrowser.uio.no

Av Yngve Vogt
Publisert 25. nov. 2013 09:53 - Sist endret 26. nov. 2013 13:17
Legg til kommentar

Logg inn for å kommentere

Ikke UiO- eller Feide-bruker?
Opprett en WebID-bruker for å kommentere