Hva har Sissel Kyrkjebø og Céline Dion til felles?

En analyse av relaterte artister på Spotify.

De aller fleste kjenner nok til Spotify, og bruker kanskje tjenesten daglig.
For deg som ikke vet en Spotify en strømmetjeneste for musikk. Her finnes det millioner av låter du kan strømme, for en fast månedspris.

Spotify har utviklet seg til å bli ett musikkmiljø hvor artister har sine egne «hjemmesider», på disse sidene finner en alt produsert av artisten, sammen med blant annet; statistikk over månedlige lyttere, hvor i verden sangene til artisten blir mest hørt og en liste over relaterte artister.

I dette innlegget skal jeg se nærmere på sistnevnte. Jeg skal ta en nærmere titt på en artists relaterte artister, ved hjelp av dette verktøyet har jeg hentet ut et datasett fra Spotify. Og ved hjelp av Gephi  har jeg laget en graf som visualiserer nettverket.
– Datasettet består av en artist og dens relaterte artister, og disse sine relaterte artister igjen.
Figur1

Beskrivelse av grafen

  • Grafen har utgangspunkt i artisten Sissel Kyrkjebø. (Den store røde noden i midten)
  • Grafen består av noder og kanter.
  • Noder er artister, kanter er relasjonen “Artista er blandt de relaterte artistene til Artistb
  • Grafen er ikke rettet, så relasjonen mellom to artister trenger ikke være gjensidig for at det skal finnes en kant.
  • Fargene representerer gruppering (ved hjelp av en samfunnsfinnende algoritme).
  • Størrelsen på nodene er basert på «Betweeness Centrality» – som sier noe om hvor ofte en node ligger på den korteste stien til andre noder. Så jo større noden er, jo flere «korteste stier» passerer gjennom denne noden.

Hvordan bestemmer Spotify hvilke artister som er relaterte?

Spotify uttaler seg ikke spesifikt om hvilke faktorer de tar med i beregningen når de velger relaterte artister. Det vi vet er at de bruker egen lytterdata for å bestemme det. Med utgangspunkt i hvilke artister lyttere hører på. Hører du på både Kurt Nilsen og Morten Harket vil dette telle mot at disse artistene er relaterte.
(kanskje prøve å skrive mer utfyllende her).

Analyse

Globale egenskaper


Ser vi på grafen over kan det se ut som den er «delt i to» på midten, ser vi nærmere kan vi få en slik inndeling

Figur2

Her kan vi se at det er en tredeling av grafen. Til venstre i grønt finner vi svenske artister, i midten i rødt finner vi norske artister, og til høyre i grafen finner vi engelske eller «ikke-norsk-talende» artister. De hvite mellomleddene er en blanding av artister, hvit til venstre er en blanding av flere språk – deriblant tysk, hvit til høyre er blanding av norsk og engelsk.

Dette kan peke på at språk har mye å si for om artister er relaterte. Om dette er en bevisst handling i Spotify sin kategoriserings metode eller om det er et naturlig fenomen er ikke lett å si.

Stier

I grafen over ser vi at det er tette sammenkoblinger innad i gruppene. Mellom de norske gruppene er det også ganske tett med tilkoblinger, men det er få mellom de svenske, norske og de engelske. Den gjennomsnittlige stil-lengden er rett i overkant av fire. Dette sier at gjennomsnitts lengden mellom to vilkårlige noder er fire (kanter). Diameteren til grafen er seks, det vil si den absolutt lengste avstanden mellom to noder i denne grafen, er seks.

Connectivity & Components

Denne grafen er tilkoblet, for alle noder kan nå alle andre noder i grafen. Dette er en stor tilkoblet komponent. Men den er ikke en klikk, det er ikke slik at alle noder har en kant mellom alle andre noder. Tettheten til grafen er 0,022 hvor en tetthet på 1 ville vært at alle noder hadde en kant til alle andre noder i grafen.

Liten verden fenomenet og seks graders separasjon

Som nevnt over er den gjennomsnittlige sti-lengden på fire og diameteren til grafen seks.
Denne grafen stemmer da overens med ideen om at alle er koblet sammen med seks eller mindre personer, gjennom bekjentskap. Seks graders separasjon stammer fra «small-world phenomenon», som er ideen om at verden er «liten» sett i lys av hvor få bekjente en må gjennom får og komme til hvilket som helt annet menneske i verden. Denne grafen består av 813 noder, så det tilsier at hvilken som helst av disse 813 artistene er innenfor hverandre sin rekkevidde med maksimalt seks steg, og med gjennomsnitt fire steg.

Lokale egenskaper

Gruppering
Å prøve å finne ut hva som er felles innad i gruppene (de forskjellige fargene) var mer utfordrende.
Det vi vet er at de ligner på hverandre, men hvilke faktorer som bestemmer er ikke like lett å sette fingeren på. Noen funn viser jeg i bildet under.

Figur3

Her kan det se ut som gruppering skjer rundt sjanger. Noen av gruppene skilte seg lett ut hvor det bare fantes sanger av en spesiell sjanger. Dette kan være tilfelle i de andre gruppene jeg ikke nevner også, men at sjangere der er bredere, slik at mer faller innunder den. Jeg har ikke full kontroll på musikk sjangere så har bare navnsatt de jeg er relativt sikker på stemmer.
blå: barnesanger, orange: klassisk, hvit: piano, lilla: putemusikk.

Lokale broer

Bildet under viser en grov skissering av to av de lokale broene. Det er flere en disse to, men med veldig lavt omfang (span). Merk at det er lokale broer og at ingen av de er en absolutt bro.

Figur4

Det som er fellesnevneren for disse to lokale broene og ser ut til å være fellesnevneren for alle de lokale broene, er at de binder sammen nasjonaliteter(eller sangspråk). Sentrale for disse broene er Sissel – som synger på norsk, og Maria Mena som er norsk men synger på engelsk.

Konklusjon

Så hva sitter vi igjen med? Kanskje ikke så alt for mye, men vi har fått litt innsikt i hvordan Spotify sin «relaterte artister» mekanisme fungerer, kanskje. Det virker jo sannsynlig at sjanger og språk skal ha noe å si for om artister er relatert. Ellers har vi funnet ut at denne grafen støtter ideen om seks graders separasjon, og det skulle det skulle en kanskje ikke ha tenkt seg. At Kurt Nilsen og Louis Armstrong bare er adskilt av tre artister er kanskje ikke noe en tenker på. Mer interessant hadde vært å studert et nettverk av ALLE artistene på Spotify og sett om dette var en stor sammenhengende komponent.

Så hva har Sissel Kyrkjebø og Céline Dion til felles ?
– jo, de har Josh Groban til felles.

Merk at dette datasettet er hentet ut 03.11.17 og «relaterte artister» kan endre seg.
Link til pdf er inkludert. – Her er nodene navnsatt. (grafen ser annerledes ut her for lagret den ikke med navn og måtte gjennskape den)

kilder

https://www.spotify.com/no/about-us/contact/

Spotify 0.3.23 – Related Artists

Networks Crowds and Markets, David Easley & Jon Kleinberg 2010 – Kapittel 2