Usikkerhet gir bedre anbefalinger

De automatiske anbefalingene på Finn.no fungerer mye bedre når algoritmene tar hensyn til usikkerheter.

MER TREFFSIKKERT: For å øke trafikken på Finn.no har Simen Eide laget et sinnrikt system som beregner sannsynligheten for hva alle de mange brukerne på nettstedet er interessert i. Foto: Yngve Vogt

Tro det eller ei! Uansett hva du leter etter på Finn.no, landets største markedsplass, blir de automatiske annonse-anbefalingene mer relevante desto mer Finn.no tar hensyn til usikkerhetene.

Etter at nettstedet tok i bruk nye usikkerhetsberegninger, har den gjennomsnittlige brukeren klikket seg inn på sju prosent flere annonser enn tidligere. Mer trafikk betyr større omsetning og mer penger i kassen.

– Det gjelder å engasjere brukeren nok til at han bryr seg om hva vi anbefaler, forteller data scientist Simen Eide på Finn.no. Han tar nå en industriell doktorgrad på BigInsight – et senter for forskningsdrevet innovasjon ved UiO – om hvordan det er mulig å bruke kunnskapen om usikkerheter for at markedsplassen kan anbefale de beste annonsene til nettopp deg som bruker.

Ut av digital boble

 La oss ta det hele fra starten. Du har klikket ti ganger på noe du er interessert i. Anta du har sett på ti biler. Før ville Finn.no ha anbefalt deg annonser med tilsvarende biler.

– Det er vanligvis slik anbefalingsalgoritmene fungerer.

Dette har dessverre noen uheldige konsekvenser. Hvis du bare blir anbefalt det markedsplassen tror du ser etter, havner du i en digital boble.

– Da vil ikke anbefalingene dekke hele interessebredden din. Simen Eide har forsøkt å gjøre noe med dette. Det har vært alt annet enn enkelt. Selv om Finn. no sitter på enorme mengder data, vet de nesten ingenting om den enkelte bruker.

– Usikkerheten er svært stor om hva brukeren er interessert i. Hvis du har sett på ti biler, men også er interessert i noe annet, er det i tillegg viktig for oss å oppdage de andre interessene dine.

Dyp læring

 For å klare dette må Simen Eide kvantifisere usikkerhetene. Anbefalingssystemet til Finn.no bygger på dyp læring, en viktig metode for å trene opp datamaskinen til å gjenkjenne mønstre i data. Problemet med dyp læring er at denne metoden ikke tar hensyn til usikkerheter.

– Vi prøver nå å bake inn usikkerheten i den dype læringen.

Hvis du har sett på femten biler og ett sofabord, er det best å vise annonser av biler, men det er samtidig en viss sannsynlighet for at du også har andre preferanser. Simen Eide tar derfor også hensyn til hva de andre brukerne, med tilsvarende interesser for biler, ser etter.

– Det eneste vi vet er at en bruker som har sett på en bil, også har stor sannsynlighet for å se på en annen bil.

Da må Finn.no finne den rette bilen blant de to millioner gjenstandene som finnes i databasen deres.

50-dimensjonal fotballbane

For å skjønne hvordan Finn.no tenker, kan du se for deg at nettstedet har plassert alle annonsene – det er altså mer enn to millioner av dem – utover en fotballbane. Hver gang en av brukerne tar en titt på to bestemte annonser, blir disse to annonsene plassert nærmere hverandre på fotballbanen.

– Brukere har en tendens til å se på lignende ting over tid. Kanskje vil alle de dyre bilene havne på den ene siden av fotballbanen, mens sofaene havner på den andre siden.

Jo kortere avstanden er mellom to objekter, desto større er sannsynligheten for at de to annonsene blir vist til samme bruker.

Det er ikke mulig å plassere alle objektene på en to-dimensjonal fotballbane. Simen Eide jobber heller ikke i tre dimensjoner.

– Vi er nødt til å sortere alle annonsene på en fotballbane med femti dimensjoner. Vi trenger så mange dimensjoner for å kunne finne den rette avstanden mellom alle annonsene.

Sannsynlighetsfordeling

Så kommer neste problem. Det handler om det Simen Eide kaller for kaldstartproblemet.

– Hvis det legges ut en ny bilannonse, er det ingen som har sett på denne bilen før. Da er det umulig å legge ut bilen på fotballbanen.

Poenget er å anbefale den til brukere så tidlig som mulig. Og det er nå Apollon omsider kommer til det saliggjørende hovedpoenget om usikkerheter. På tide! Og nå snakker han om brukerne og ikke annonsene. Han legger også brukerne inn på fotballbanen.

– Vi legger også brukerne på fotballbanen, men vi er usikre på nøyaktig hvor de skal plasseres. Det er ikke nok å legge dem på et bestemt punkt. Vi må også lage en sannsynlighetsfordeling for hvert av disse punktene.

Det betyr at alle brukerne får et område på fotballbanen der de med en viss usikkerhet kan ligge.

– Sannsynligheten blir da kanskje størst for at brukeren fortsatt ønsker å lete etter en annen bil, mens sannsynligheten også er til stede for at han har lyst til å se etter et sofabord.

Etter at Finn.no la denne spesielle formen for usikkerhet inn i modellen, økte klikkraten med sju prosent.

– Det er bra. Hvis folk finner annonsene mer interessante, vil de kjøpe og selge mer. Vi får da mer fornøyde brukere, samtidig som Finn.no får en sterkere posisjon i markedet.

Tunge beregninger

Det krever en del datakraft for å ta hensyn til alle usikkerhetene. Dette er intet stress for akademikere. Det har ingenting å si for dem om de må bruke en ukes databeregninger for å trene opp modellen.

I det virkelige liv er en uke altfor mye. Før alle beregningene er i boks, er resultatene i mellomtiden blitt irrelevante. Det er derfor viktig at markedsplassen klarer å løse beregningene i løpet av noen få nattetimer, slik at brukerne kan få de beste anbefalingene når de setter seg ved tastaturet neste morgen.

– Jo fortere vi får dette til, desto mer ferskvare blir resultatene.

Det beste hadde vært om det var mulig å trene opp modellen i sanntid, slik at Finn.no vet hva brukeren er interessert i der og da.

– Med en liten algoritme skal det være mulig å få fornuftige resultater i løpet av 80 millisekunder. Det betyr at systemet vårt kan beregne hva du liker best hver gang du klikker deg inn på nettstedet.

Spiller med åpne kort

Selv om alle algoritmene blir publisert i vitenskapelige tidsskrifter, er ikke Simen Eide redd for at noen andre luringer skal stikke av gårde med ideene hans.

– På konferanser utveksler vi ideer med konkurrentene våre. Det er givende. Verdien av algoritmene er begrenset kommersielt. Finn.no er mye mer enn dette. Men den gangen jeg jobbet i finansverdenen, diskuterte vi ikke løsningene med andre. Det hadde vært mye farligere for bedriften.

Av Yngve Vogt
Publisert 6. mai 2022 09:30 - Sist endret 6. mai 2022 09:32
Legg til kommentar

Logg inn for å kommentere

Ikke UiO- eller Feide-bruker?
Opprett en WebID-bruker for å kommentere