Rik blir rikere og den lange halen

Jeg tror jeg kan tørre å påstå at alle som har brukt en datamaskin med internettilkobling også har brukt Google. Et fenomen som oppstår her er at sider som inneholder informasjon om et ganske spesifikt emne, som for eksempel et obskurt dataspill eller lignende, kan bli store i en gitt kontekst som følge av den lange halen. Jeg vil her prøve å forklare hvordan Google og andre nettsted rangerer treff for å gi de mest relevante treffene først. Jeg vil også se på forskjellen på promotører som er avhengig av å vise de største først, sammenlignet med nettsted hvor ikke nødvendigvis dette er tilfellet.

På google dukker det opp en boks under søkefeletet som viser treff som kan være aktuelle for ditt søk. Da jeg gjennomførte mitt eksperiment, skrev jeg noe så enkelt som et guttenavn, ”Jim”. Det er et uvisst antall menn i verden som heter Jim, men allikevel var det bare to alternativ hvor de faktisk het ”Jim”, nemlig ”Jim Carrey” og ”Jim Parsons”. Hele listen over treff  ser du i bildet under:

Skjermdump Google 31.10

Skjermdump fra Google-søk 31. Okt 2012

Det betyr altså at selv om jeg kanskje er på jakt etter informasjon om Jim Stärk, får jeg opp alternativ som ikke egentlig er relevant for søket mitt. Dette er nettopp som følge av ”rik-blir-rikere” fenomenet. I følge Googles egen support side er dette på grunn av: ”Predicted queries are algorithmically determined based on a number of purely algorithmic factors (including popularity of search terms) without human intervention. The autocomplete data is updated frequently to offer fresh and rising search queries.” – Google (2012). Her står det ganske tydelig at et Google-søk promoterer de mest populære søketermene, altså at rik blir rikere. Det ser vi også i mitt eksempel over. Som de aller fleste vet, er Jim Carrey en Hollywood-skuespiller og komiker. Ettersom så utrolig mange har hørt om skuespilleren og hans prestasjoner, vil han naturligvis være oftere søkt etter enn Jim Stärk som er et musikk-band fra vesle Oslo.

Hva så med ”den lange halen”? Lurie (2010) definerer den lange halen slik: ”Specific, niche search phrases, usually more than 2 words in length, that offer a low competition, low search volume and high searcher intent” (Lurie, 2010). Med dette i tankene kan man tenke seg at et firma prøver og promotere det de selger, la oss i dette eksempelet si sykler. Søker man det generelle søkeordet ”sykkel” eller ”sykler”, er det som tidligere nevnt de største som vinner (rik blir rikere fenomenet). Den lange halen oppstår først i mer spesifikke søk. Eksempel kan være når man søker etter ”sykler i Bergen”. Man får her opp lokale sykkelbutikker, imens søket på sykler gir oss topptreff som landsomfattende sportskjeder som XXL og store internasjonale sykkelfirma.

Når promotører er ute etter å øke antall besøkende på sitt nettsted, ønsker søkemotorene at promotørene skal kjøpe plass på de største søkeordene. Det vil si at dersom du skal promotere firma ditt som selger sykler, vil Google og andre søkemotorer at du betaler dem for annonseringen. I mitt eksempel vil det si at Google ønsker å få navnet ditt høyt på et søk etter ”sykler” eller ”sykkel”. Det søkemotorene ikke er interessert i, er de mer spesifikke søkene hvor ingen har betalt for å komme på topp.  Dette fører nemlig til at søkemotorene ikke tjener penger på søket, og firmaene som nå kommer på topp får et topp-treff helt gratis. Lurie (2010) har i sin artikkel om den lange halen forklart et lignende eksempel. Han beskriver her  et tilfelle hvor en promotør som selger sokker skal promotere sin bedrift. Ønsket er jo å komme høyest opp på de mest generelle søke-termene som ordet ”socks”. Eller er det det? Lurie forklarer videre hvordan det generelle søkeordet ”socks” tilslutt ender opp med å gi mindre treff for promotøren enn de lengre og mer konkrete søke-termene. Det finnes hundrevis av andre søke-termer som også gir treff til denne bedriften, men hvor man slipper å betale for å komme høyt på resultatlista. Søketermer Lurie bruker som eksempel er: ”socks with dogs on them”, ”socks with cats on them” og ”socks that knock my socks off”. Se bildet under.

Utklipp fra artikkelen til Lurie

Utklipp fra artikkelen til Lurie (2010)

Teksten Lurie har skrevet til bildet er: ”The end result is that all those long tail phrases actually generate more revenue”. Det vil si at de lengre søketermene til slutt kan gi like god (om ikke bedre) dekning av en promotør enn den betalte plassen på et generelt søkeord.

Dette er selvfølgelig noe søkemotorene ikke liker, og det er spesielt Google jeg vil ta for meg. Google har nemlig jobbet hardt for å bli kvitt alle disse nisjesøkene. SEO Book (2012) har laget en grafisk fremstilling av hvilke tiltak Google har tatt i bruk. Jeg vil ta for meg noe av det Google har gjort for å redusere slike nisje-søk, hele skissen til SEO Book finner du i vedlegg en. Google har blant annet implementert stavekontroll direkte i søkefeltet, ”Google Instant” i tillegg til at de tillater seg å foreslå endring av hele søkefraser. Bildet under viser hvordan stavekontrollen fungerer. Dette bildet viser også et eksempel på ”Google instant”. Det denne gjør er at den prøver å få søkerne inn på mer populære søk for å unngå at brukeren utfører et nisjesøk.

På denne måten gjør Google nisjesøkene mindre aktuelle, fordi brukeren vil tro at det er større sannsynlighet for å finne det han/hun er på jakt etter i Googles egne tips. I tillegg oppdaget jeg i dette søket at selv om jeg hadde skrevet feil, fikk jeg både forslag om retting av ordet, populære søkefraser i tillegg til at Google hadde rettet søkefrasen min automatisk. Uten at jeg hadde godtatt, hadde Google lagt inn en tekst: ”Viser resultater for long tail”. Google prøver som nevnt i noen tilfeller å endre hele eller store deler av søket. Eksempelet SEO Books bruker i sitt eksempel er et søk på ”Weight loss estimator” hvor Google foreslår ”Weight loss calculator”, SEO Book (2012).

Ut ifra det vi har sett til nå, er det rimelig å anta at Google promoterer de største treffene først av økonomiske grunner. De vil på denne måten få folk til å ønske å annonsere på de største søkeordene, og derfor tvinge folk inn i den store kroppen i stedet for den lange halen. Hva så med sider hvor økonomi ikke primært har noe å bety? Jobber de like mye for å få folk ut av den lange halen, og inn i den store kroppen? Jeg har valgt og også se på et annet nettsted hvor fenomenet rik-blir-rikere oppstår, men hvor det er lettere å se sammenhenger, nemlig reddit.com. Når man går inn på Reddit, kommer man automatisk inn på en fane ”Hot”. Dette er en samleside over de mest populære reddit postene. Denne oppdateres kontinuerlig, så innholdet forandres også hele tiden. I motsetning til Google som jobber for å få folk inn i den store kroppen, jobber Reddit også for å promotere den lange halen, slik at de mest populære postene ikke ligger for lenge på toppen. Hadde dette vært tilfelle, tror jeg ikke folk ville besøkt Reddit så hyppig, og Reddit hadde ikke vært på langt nær så populært som det er i dag. Dessuten kan vi på Reddit se hvor mange som har likt, ikke likt og kommentert på postene.

Skjermdump Reddit 06.11

Skjermdump av reddit 6. Nov 2012

Som vi ser ut fra skjermdumpen har de fleste postene relativt høyt antall personer som har trykket liker eller kommentert posten. Det man samtidig legger merke til er at det ikke er alle postene som har noe særlig høyt antall, men som allikevel ligger høyt på denne listen. Hvorfor Reddit gjør dette står i kontrast med Google. Google jobber primært med å få folk inn i den store kroppen, og bort i fra den lange halen. Imens Reddit i tillegg til å promotere den store kroppen, også jobber med å få folk utover den lange halen. Grunnen til dette er som tidligere nevnt for å kontinuerlig endre hva som er mest populært, og på denne måten hele tiden kunne gi nye poster til brukerne sine.

Hvordan dette gjøres er ved bruk av flere metoder. Jeg vil kort beskrive to av metodene som Reddit har brukt i tillegg til liker- og kommentar-funksjonen. Reddit bruker ifølge Salihefendic (2010) et tidsaspekt og en logaritmisk funksjon. ”Submission time has a big impact on the ranking and the algorithm will rank newer stories higher than older. The score won’t decrease as time goes by, but newer stories will get a higher score than older. This is a different approach than the Hacker News’s algorithm which decreases the score as time goes by” – Salihefendic (2010). Videre sier han at Reddit bruker en logaritmisk funksjon for å vurdere likes. Det vil si at de første 10 stemmene har samme vekt som de neste 100, og disse 100 har videre samme vekt som de neste 1000 etc. Videre har Reddit også ”down-votes”, dette er uten nærmere forklaring negative stemmer. Dette gjøres hos Reddit for å unngå at de samme postene ligger lenge på toppen, og på denne måten får de brukere til å ønske å komme inn igjen på nettstedet deres hyppig.

Det er rimelig å anta at også Google hele tiden forandrer sine topptreff avhengig av tid og antall klikk. Det er lite sannsynlig at det som var topptreff på et gitt tema for fem år siden er det samme topptreffet i dag. Jeg sier ikke at det ikke er mulig, men vi kan likevel anta at det ikke er det.

For å oppsummere ser vi at både Google, Reddit og mange andre jobber for å promotere de viktigste, største og mest relevante treffene. Dette skjer nettopp som følge av at rik-blir-rikere og den lange halen. Imens Google promoterer de største treffene av økonomiske grunner, gjør reddit det som følge av underholdning, få brukerne til å ønske å besøke siden på nytt, samt for å beholde eksisterende brukere. Reddit jobber i tillegg med å promotere de postene som er spredd utover den lange halen, for å hele tiden kunne oppdatere hva som ligger på topp når brukerne besøker Reddit sitt nettsted. 

Vedlegg

Vedlegg 1: Grafisk fremstilling av “How Google killed the long tail”.

Den lange halen Google grafisk fremstiling

Litteraturliste

Google Support (2012), Autocomplete [Internett], tilgjengelig fra: http://support.google.com/websearch/bin/answer.py?hl=en&answer=106230 [Nedlastet 13. Nov 2012]

Lurie, Ian (18. Oktober 2010), SEO 101: Defining the long tail [Internett], tilgjengelig fra: http://www.portent.com/blog/seo/long-tail-seo-101-defined.htm [Nedlastet 4. Nov 2012]

Salihefendic, Amir (23. November 2010), How Reddit ranking algorithms work [Internett], tilgjengelig fra: http://amix.dk/blog/post/19588 [Nedlastet 6. Nov 2012]

SEO Book (©2003-2012), How Google killed the long tail [Internett], tilgjengelig fra: http://www.seobook.com/learn-seo/infographics/longtail-fail.php [Nedlastet 4. Nov 2012]