Googles søke algoritme
Når vi søker på Google så er vi ute etter et svar. Når vi har søkt etter noe så må Google sortere etter flere hundre milliarder nettsider og da gi deg et svar på veldig kort tid (Google, 2017). Men hvordan analyserer Googles algoritme søkeordene og hvordan ser den hvilke nettsider som er relevante for oss? I denne teksten skal jeg ta for meg dette.
Analysering av ord
Systemet til Google som rangerer søke treffene er bygget opp av en rekke algoritmer som prøver å gi deg de søke treffene du er ute etter. Det starter med at de analyserer ordene du søker med slik at de skal forstå hva du søker etter. Etter dette bruker de språkmodeller som kan finne ut hvilke ord de bør søke opp i systemet sitt. De kan på denne måten f.eks finne ut om ordet som er skrevet er skrevet feil og da rette dette opp, samtidig som algoritmen prøver å finne ut hva folk mener med setningene som blir skrevet. Google har også et synonym system som hjelper de i enda en større grad å finne ut meningen bak søket (Google, 2017). Dette er noe jeg har merket når jeg skriver et ord eller en setning feil. Man får da med en gang et alternativ til ordet eller setningen der det står ”mente du: ord”. Jeg har også lagt merke til at systemet filtrerer synonymer bra. Etter å ha søkt på ”Quick way to lose weight” i Google søkefeltet, så var det første resultatet ”how to lose weight fast”. Jeg kunne da se at Google’s system oversatte ”quick” til ”fast”. Selv om det tredje resultatet faktisk inneholdt ordet quick, så ble ikke den det øverste rangerte treffet. Se figur 1.
Figur 1: https://imgur.com/RZYIr1I
Finne relevante søketreff
Etter at ordene er skrevet inn og Google sin algoritme tror den har forstått hva du er ute etter, så prøver de å finne ut hvilke nettsider som har den informasjonen du er ute etter. Det som ligger helt til grunn etter at noen har søkt er at algoritmen ser hvilke nettsider som inneholder de søkte ordene og hvor mye ordene er nevnt og hvor på nettsiden ordene befinner seg. På toppen av dette prøver algoritmen å se etter ledetråder for å regne ut hva folk er ute etter med søket sitt. For å forhindre at f.eks søkeordet ”melk” gir deg topp resultater med nettsider der det er skrevet “melk” over alt, så prøver algoritmen å se om nettsiden gir relevant informasjon om melk. Når man søker det norske ordet ”melk” ønsker man som regel ikke få et engelsk treff med engelsk informasjon. Google prøver da å gi søkeresultater som er skrevet på samme språk som søkeordet, i dette tilfellet er det norsk (Google, 2017). Av min egen erfaring så har det aldri vært et problem å ikke få relevante resultater. Det samme gjelder når jeg har søkt etter norske ord.
Finne brukbare nettsteder
Ut fra alle de forskjellige relevante søke treffene, så må Google ved hjelp av en algoritme finne ut hvilke av disse som er mest brukbare innenfor det du har søkt etter. Det er forskjellige aspekter algoritmen ser på. Den ser på blant annet hvor ny og oppdatert siden er, om nettsiden er brukervennlig og hvor mye det du har søkt etter dukker opp på siden. Algoritmen ser også etter tidligere søk som andre har søkt og deretter prioriterer de treffene som andre folk har sett verdi i. Også om andre store nettsider har linket til en nettside anses det som at det er god kvalitet på innholdet, og dette er et godt tegn for algoritmen. Selv om spam-nettsteder prøver å få seg høyt opp i page-ranking ved hjelp av tjenester som linker til siden eller ved å repetere nøkkelord, så blir de nedprioritert da Google har en algoritme som klarer å fjerne disse fra søkeresultatene (Google, 2017). Å få opp mange spam-nettsteder som søketreff er noe jeg har erfart å få litt av før, men gjennom de siste 5 årene har jeg ikke erfart å få spam-nettsteder rangert høyt oppe på søketreff.
Tilpasse søkene etter brukerne
Å se på folks tidligere søke-historikk og søkeinnstillinger hjelper Google med å finne relevante søketreff. Bruken av lokasjon gjør at Google kan finne ut mer relevante søkeresultater. La oss si at du søker “kinesisk restaurant”, så vil Google prøve å gi deg et topp treff på en kinesisk restaurant som er i nærheten av deg. Søkeinnstillinger hjelper også da du kan blant annet velge at søkeresultatene kun skal være skrevet på et gitt språk. Søke-historikken gjør det mulig for Google å gi rett svar når man skal søke etter noe. Så om du har søkt mye etter rock musikk og senere søker etter ordet rock, så kan rocke musikk resultater komme høyere opp fremfor objektet rock, altså en stein (Google, 2017). Jeg prøvde å finne et ord som blir skrevet likt på forskjellige språk. Da valgte jeg ordet Hamburger. Hamburger blir skrevet likt på både Norsk, Engelsk, Tysk og flere språk. Spørsmålet var da hvilket språk top resultatene ville ha. Etter å ha søkt på ”Hamburger” på min private datamaskin fikk jeg norske søketreff. Dette er da blant annet på grunn av at Google ser jeg har surfet på norske nettsteder tidligere og kan se at min lokasjonen er i Norge. De antar da at jeg snakker norsk og vil ha et norsk nettsted om Hamburger. Se figur 2.
Figur 2: https://imgur.com/yxNFoEH
Når dataene er samlet
Helt til slutt så samler Google all denne informasjonen og prøver å gi deg de aller beste søkeresultatene. Dette systemet kommer til å fortsette å utvikle seg (Google, 2017). Av egen erfaring så blir søkeresultatene bedre for hvert år som går, og de blir trolig enda bedre de neste årene.
Referanseliste:
Google (2017) How Search algorithms work [Internett] Tilgjengelig fra: <https://www.google.com/search/howsearchworks/algorithms/> [Lest 03.11.2017]