Vanligst med konservativt bokmål

Landets siste bokmålsvokter har samlet over 100 millioner ord i en svær bokmåls-database. Frem er like vanlig som fram. Bare én av seks tekster er på radikalt bokmål.

VARIANTER: Noen «begår selvmord», andre «tar selvmord » og noen «gjør selvmord ». Nå skal Ruth E. Vatvedt Fjeld sjekke den statistiske fordelingen av selvmordsordbruken i det leksikografiske bokmålskorpuset. Foto: Yngve Vogt

Bokmålsbrukere som sverger til a-endelser,  kan  gremme seg.

– Radikalt bokmål forekommer sjeldent. Fem av seks tekster er skrevet på konservativt bokmål, konkluderte universitetslektor i nordiske språk Kjersti Wictorsen Kola da hun i mastergraden sin i fjor sjekket den statistiske fordelingen i radikal og konservativ bruk av bokmål.

Det er nesten ingen som bruker a-endelser i fortidsformer av svake verb. Det er like vanlig å skrive frem som fram. Det er nesten like mange som bruker ben som bein. Og det er nesten like populært å skrive syv som sju.

Uten universitetets enorme tekstsamling, med det lite fengende navnet «Leksikografisk bokmåls-korpus», ville det ikke ha vært mulig å undersøke bruken av de ulike ordformene. Korpuset er en dokumentasjon på hvordan bokmål er blitt brukt som skriftspråk gjennom tretti år fra 1985 til 2014.

– Dette er en strukturert samling med over hundre millioner ord fra så ulike tekster som romaner, lærebøker, masteroppgaver, blogger, tidsskrifter og NRK-tekster. Tekstutvalget er basert på SSBs undersøkelser av folks lesevaner. Nesten halvparten av tekstene er sakprosa, en fjerdedel er skjønnlitteratur, en femdel er aviser, og resten er TV-tekster og upubliserte tekster, forteller primus motor for bokmålskorpuset, professor i nordiske språk, Ruth E. Vatvedt Fjeld ved Universitetet i Oslo.

Alle tekstene er merket med forfatterens kjønn, alder og hvor de er vokst opp. Det gjør det mulig å lete etter spesielle, språklige særtrekk hos kvinner og menn, unge og gamle og om det er forskjellig bruk av bokmål på Østlandet og i Nord-Norge. Ordene er dessuten grammatisk merket med ordklasse.

Skattejakten

LITE RADIKALT: Fem av seks tekster i leksikografisk bokmålskorpus er på konservativt bokmål, forteller Kjersti Wictorsen Kola. Foto: UiO

For noen år siden brukte Vatvedt Fjeld korpuset til å slå fast at det er langt vanligere å skrive uken enn uka, jorden enn jorda og solen enn sola. Unntaket var NRK-tekstene. Der vant a-endelsene en soleklar seier.

Nå er hun i gang med en ny skattejakt. Hun skal undersøke bruken av fraser, altså brukskombinasjonen av flere ord. Et eksempel er hvordan folk tar selvmord. Noen «begår selvmord», andre «tar selvmord» og noen «gjør selvmord».

– I dagens ordbøker er frasene ofte hentet fra gamle ordbøker, men det er aldri gjort en statistisk analyse av hvilke ord som hyppigst forekommer sammen.

Vatvedt Fjeld ønsker også å undersøke i hvilken grad fraser brukes feil. En som skriver «ta hele skrittet ut», mener kanskje den mer dannete varianten «ta skrittet helt ut».

En av de mange overraskelsene hun fikk, var da hun oppdaget at dommere ikke alltid er sikre på hva de mener med å «legge til grunn». Selv om man skulle anta at tingenes tilstand er bevist når dommere i rettsdokumenter legger noe til grunn, bruker dommerne ofte det samme uttrykket selv om de bare går ut ifra eller antar noe.

Unngår skjevt bilde

Vatvedt Fjeld poengterer at bokmålskorpuset er Skandinavias eneste vektete tekstsamling.

– Med et vektet korpus kan man dokumentere spredningen av ord eller uttrykk og hvor vanlig de forekommer i forskjellige typer tekster.

Alle de andre skandinaviske korpusene, og da snakker vi om ordsamlingene både for nynorsk, dansk og svensk, er uvektet.

I uvektete korpus er faren til stede for at forskerne baserer seg på intuisjon når de jakter på sentrale ord og at de ikke fanger opp om faguttrykk er blitt en del av allmennspråket. Faren er også til stede for å gi et skjevt bilde av ordets status i språk- et. Hvis ett ord er hyppig brukt av bare én sentral forfatter, kan det få altfor mye plass i uvektete korpus.

– Da blir ordbøkene feil. I et vektet korpus kan jeg dessuten undersøke fordelingen av uttrykk hos kvinnelige og mannlige eller unge og eldre forfatt-ere. Hvis vi baserer oss på et tilfeldig ordutvalg, har vi ingen muligheter til å sjekke dette.

Noen ord har begrenset levetid.

– Et eksempel er askefast. Det er ingen grunn til å ha med slike midlertidige underholdningsord i ordbøker. Poeng- et er å dokumentere de allmenne ordene vi kan regne med å komme bort i, og dermed ha behov for å slå opp.

Dokumenterer språket

For noen år siden hadde UiO fire leksikografer i bokmål. Nå er tre av dem gått av med pensjon. Vatvedt Fjeld, som nylig fylte 67 år, er nå landets siste leksikografiske bokmålsvokter.

Meningen var at bokmålskorpuset skulle bli grunnstammen i den nye oppdateringen av bok-målsordboken, men universitetsledelsen har nå vedtatt at universitetet ikke lenger skal redigere ordbøker.

Vatvedt Fjeld beklager at fremtidens bokmålsordbok ikke blir bygd på korpuset.

– Den eksisterende ordboken er stort sett laget ut ifra gamle ordbøker, intuisjon og uten faglig grunnlagsmateriale. Jeg bygde derfor opp det leksikografiske korpuset for å kunne få et godt grunnlag til den tiltrengte ordbokoppdateringen, påpeker Vatvedt Fjeld.

Et av de mange eksemplene på svakheter i dagens ordbok, er den foreldete frasen «Gjøre sine hoser grønne» under adjektivet grønn. Det mer moderne uttrykket «å ha grønne fingre» er derimot ikke med.

Ettersom Vatvedt Fjeld ikke har fått midler til å vedlikeholde korpuset, vil det etter hvert ikke bli mulig å bruke korpuset til å studere de nyeste endringene i bokmål.

– Hvis korpuset skal kunne brukes til ordboksarbeid, må det stadig fylles opp med nye tekster. Hvis ikke får vi hull i beskrivelsen av det norske ordforrådet. Inntil videre er vi nødt til å gjette oss til eller google opp hvilke ord og uttrykk som er kommet i vanlig bruk etter 2014. Da blir det mer tilfeldig hva slags treff vi får, beklager Vatvedt Fjeld.

Av Yngve Vogt
Publisert 14. aug. 2015 11:00 - Sist endret 27. aug. 2015 15:56
Legg til kommentar

Logg inn for å kommentere

Ikke UiO- eller Feide-bruker?
Opprett en WebID-bruker for å kommentere