I verdenstoppen på gensøk

Enorme mengder gener fra dyr, planter og mennesker er blitt kartlagt de siste årene. Nå kan forskerne søke gjennom gendataene opptil ni ganger raskere enn før, ved hjelp av en vanlig PC og dataprogrammene til UiO-forsker Torbjørn Rognes. Programmene er verdens raskeste og mest nøyaktige når en skal finne likheter mellom gener, ifølge professor Erling Seeberg ved Instituttgruppe for laboratoriemedisin.

SUSER GJENNOM GENENE: Professor Erling Seeberg (t.v.) og forsker i bioinformatikk Torbjørn Rognes.  Foto: Ståle Skogstad (©)

– Betyr det at alle snart kan sitte ved PC-en og sammenlikne egne gener med partnerens, for å se om det er fare for å få barn med arvelige sykdommer?

– Det er nok fremdeles en stund til, sier Rognes.

– Det er nemlig dyrt å kartlegge gener. I dag koster det milliarder av kroner å sekvensere alle genene til en person. Men hvis sekvensene er kjent, vil det være teknisk mulig å gjøre et sånt søk på en vanlig PC.

Rognes er den første som har tatt doktorgrad i klassisk bioinformatikk ved Universitetet i Oslo, og han arbeider nå ved Seksjon for molekylærbiologi på Rikshospitalet. Der brukes dataprogrammene først og fremst til å finne ut hvilke funksjoner forskjellige gener har.

En måte å finne ut hva slags funksjon for eksempel et menneskegen har, er å finne et mer eller mindre identisk gen, for eksempel hos en bakterie. Dersom en kjenner dette genets funksjon i bakterien, er det mye som tyder på at det tilsvarende menneskegenet har omtrent samme funksjon i mennesket.

Dermed slipper forskerne å stå i laboratoriet og utforske hvert eneste gen i hver eneste organisme fra bunnen av. Ved å søke i gendatabasene blir det enklere å snevre inn hva som bør utforskes, og laboratoriet kan brukes mer til å bekrefte eller nyansere det som kommer fram gjennom datasøkene, enn til å eksperimentere mer eller mindre i blinde.

12 gigabyte med gener

I dag kjenner vi nesten hele genmaterialet til mennesket og til over 40 andre organismer. Men vi kjenner ikke funksjonen til hvert enkelt gen. Mennesket har rundt 30 000 gener, men grovt sagt kjenner vi funksjonen til bare en tredel.

Databasene som inneholder alle kjente gener, utgjør over 12 gigabyte. Nye data kommer stadig til, og ved nyttår er databasene sannsynligvis blitt dobbelt så store.

– Det mangler gode informatikkverktøy til å behandle all informasjonen i gendatabasene. Dette har vært en av flaskehalsene i denne forskningen. Når vi søker, er vi avhengig av å få svar raskt slik at vi kan gå videre og søke på andre måter og dermed få stadig bedre svar, sier veileder Erling Seeberg, som arbeider sammen med Rognes.

Og nå skal det altså gå atskillig raskere og bedre enn før. Programmene til Torbjørn Rognes søker opptil ni ganger raskere enn tidligere søkeprogrammer, ved å ta i bruk en teknikk som også søkemotorene på Internett bruker:

– Søket blir delt opp i mange mindre deler. Så kan datamaskinen søke på alle de mindre delene samtidig, det kalles parallellisering, forteller Rognes.

I tillegg til at dataprogrammene er raske, er de også sensitive, slik at de klarer å finne de vesentlige likhetene mellom gener og overse uvesentlige forskjeller.

Mennesker og aper

MANGE LIKHETER : Et protein fra bakterien E.coli (over) og et protein fra et menneske (under) kan være svært like i deres romlige struktur. Disse to proteinene reparerer skader i arvestoffet.   Foto: Ståle Skogstad (©)

Selv om vi opplever at et menneske og en ape er nokså ulike, er genmaterialet temmelig likt. Det er bare om lag fem promille av genmaterialet til mennesker og aper som er forskjellig. Mellom to mennesker er forskjellen enda mindre, bare rundt én promille. Genmaterialet til en bakterie er også forbausende likt det vi finner hos mennesket.

Dette kan forskerne dra nytte av når de skal kartlegge genenes funksjon. Genene er særlig like hvis de oppstod i et tidlig stadium av artenes utvikling. Dette gjelder for eksempel såkalte DNA-reparasjonsgener, som er ganske like i de fleste organismer. Reparasjonsgenene sørger for å reparere skader som har oppstått i cellenes genmateriale, for eksempel etter radioaktiv eller ultrafiolett stråling eller simpelthen på grunn av såkalt reaktive oksygenmolekyler som finnes naturlig hos alle høyerestående organismer.

Slike feil i genmaterialet oppstår hele tida i hver celle, faktisk har det oppstått millioner av feil i kroppen bare på den tida det tar å lese denne artikkelen. Grovt sett forekommer det 100 000 feil i døgnet i hver celle. Forskningsgruppa til Erling Seeberg har arbeidet lenge med å kartlegge reparasjonsgener, og nå har de fått nyttige datahjelpemidler.

Tar tid

Forskningen som Rognes og Seeberg er en del av, kan også bli nyttig for folk flest:

– For eksempel vet vi at folk reagerer forskjellig på medikamenter. Noen får ingen effekt, andre får bivirkninger, andre kan bli friske. Genene kan fortelle oss hvorfor. Ved å få en fullstendig genprofil for ulike mennesker, vil det bli lettere å se hva slags medisiner som passer for den enkelte.

Seeberg understreker at det vil ta minst 20 år før vi får noenlunde oversikt over hva de forskjellige genene styrer.

– Det er mye debatt om genforskning og etikk. Er etiske vurderinger noe som preger deres arbeid til daglig?

– Alle tenker nok over hva vi gjør, og etiske hensyn kommer sterkere og sterkere, sier Rognes.

Professor Seeberg bruker sterkere uttrykk:

– Det er vanskelig å tenke seg at det er noe etisk betenkelig med selve dataprogrammene. Likevel er de med på å flytte kunnskapsfronten, som igjen gir oss nye muligheter. Det kan være både positivt og negativt. Hvilken type forskning og hva slags inngripen i menneskets natur man skal tillate, er noe som det internasjonale samfunn må ta stilling til. I Norge har vi hatt en tendens til å skulle være ”moralens voktere” på dette punktet, og debatten har tidvis vært preget av religion, noe som ikke nødvendigvis er det samme som det etisk forsvarlige. Etikere er ofte langt mer radikale enn folk flest, de har tenkt grundigere gjennom sakene, sier han.

Bioinformatikk er et lite fagfelt i Norge, og bidraget fra Norge til den internasjonale forskningen er totalt sett nokså lite.

– Men programmene som Torbjørn har laget, er verdens beste søkeverktøy per i dag når det gjelder å finne likheter mellom gener. De optimaliserer hastighet og kvalitet, forteller Seeberg.

Han og Rognes planlegger å selge programvaren, blant annet til legemiddelprodusenter og andre forskningsmiljøer. De håper å få midler til å ansette flere folk og utvikle et større fagmiljø innen bioinformatikk ved Universitetet i Oslo.

Emneord: Matematikk og naturvitenskap, Basale biofag, Molekylærbiologi, Bioinformatikk Av Marianne Tønnessen
Publisert 1. feb. 2012 12:09
Legg til kommentar

Logg inn for å kommentere

Ikke UiO- eller Feide-bruker?
Opprett en WebID-bruker for å kommentere