Facebook Data

 

Har du noen gang lurt på hva og hvor mye Facebook lagrer om deg som bruker? I dette blog-innlegget skal vi se litt nærmere på hva som blir lagret, litt om hva dataen brukes til, hva vi kan få tilgang til og hva vi kan hente ut av all dataen.

Først skal vi se litt på hva Facebook lagrer. Denne listen er veldig lang og inkluderer blant annet fornavn, etternavn, fødselsdato, jobb, skole, venner, linker du har trykket på, arrangementer du har deltatt på, enheter du har logget på med, ip adressen, bilder, samtaler, pokes, tidligere arbeidsgivere, avslåtte venneforespørsler, grupper, språk du snakker, kjønn, sivil status, e-post og mye mye mer. Dette kan Facebook blant annet bruke til å gi deg reklame rettet mot akkurat deg.

Vi skal nå se litt på hva som ligger lagret på Facebook sine servere. Vi skal se på to metoder for å gjøre dette. Den første er den enkleste, og det er Facebook som har laget en egen funksjon hvor brukere kan laste ned og se «all» informasjon om seg selv. Dette gjør du ved å gå på «Innstillinger->last ned en kopi av informasjonen din på Facebook». Du må da først skrive inn passordet ditt på nytt, før du får en beskjed om at Facebook samler sammen informasjonen din. Ca 5minutter senere får du en e-post med nedlastningslink til en komprimert mappe som inneholder din Facebook informasjon. Overraskende nok, så inneholdt denne mappen bare 13,8MB, noe jeg syns var litt lite med tanke på at jeg har vært medlem siden 2008.

img1

Denne mappen inneholder to mapper, en for bilder og en for annen informasjon i HTML-dokumenter. Det er også et HTML-dokument som binder sammen all informasjonen til en side, slik at du slipper å åpne alle dokumentene en etter en.

img1

Her er skjermbildet du møter når du har åpnet «index.htm» filen, som viser deg all informasjonen om deg. Som vi ser på bildet er det listet opp link til profil, e-post, registreringsdato, fødselsdato, kjønn, tidligere navn, bosted, sivilstatus, familie, utdanning, nåværende og tidligere arbeidsgiver, hvilke språk jeg snakker, hvilken musikk jeg liker, hvilke grupper jeg er medlem i, fotball-lag som jeg heier på, hvilke nettverk jeg er medlem av og andre side jeg liker.

Videre på «Contact Info» ligger min e-post privat og min facebook e-post. Itillegg ligger mobilnummeret mitt og e-post adressen til alle vennene mine i en adressebok.

På «Tavla» er all informasjon om ting som er skrevet på tavla mi, eller på veggen som det også kalles.

Under «Bilete» fins alle bildene mine som jeg har delt på Facebook

Under «Vener» er det en liste over alle mine Facebook-venner.

Under «Meldigar» ligger alle meldinger som er sendt privat til og fra alle. Denne filen i seg selv er alene 13MB, så det vil si at mesteparten som du laster ned er meldingene dine.

«Dult», eller «Poke» som det egentlig heter er en oversikt over pokes som er gjort fra eller til deg.

«Hendinger» gir en oversikt over alle arrangementer som du har deltatt på, med dato.

«Innstillingar» viser alle innstillingene på din bruker, som f.eks instillinger for varsel, personverninnstillinger, og hva som er gjemt fra nyhetsoppdateringer.

«Security» gir en liste over aktive innlogginger, med Ip-adresse, nettleser, operativsystem, dato osv.

«Ads» inneholder hvilke reklame jeg har trykket på, og hvilken reklame som er «relevant» for meg. Hvor relevant disse er varierer veldig. La oss se på to eksempler. Elkjøp er den ene i listen. Veldig relevant i grunnen siden det er en butikk jeg har handlet mye hos. En annen som står i listen er Detroit Red Wings, som er veldig irrelevant med tanke på at jeg ikke vet hva eller hvem det er.

Synked photos, Moblile devices og private notes er alle tomme.

Dette var alt som jeg fikk laste ned med Facebook sitt verktøy. Så da får vi se på den andre metoden for å få se på Facebook dataen vår. For å gjøre det må vi bruke et tredjeparts verktøy for å hente ut data. Et av disse verktøyene heter «Give me my data» som er en Facebook applikasjon. Dette verktøyet er veldig lett å jobbe med og kan hente ut veldig mye. Den kan hente ut:

Checkin, Connection, Developer, Events, Family, Friends (contacts), Friends (name), Friends (data), Friends (request), Groups, Group members, Group feeds, Inbox, Likes, Links, Notes, Notifications, Pages (admin), Pages (fan), Page, Photos, Photos tagget, Photo album, Pokes, Profile, Status updates, Stream filters, Subscribers (me), Subscriptions (mine), Video, Video tagged, Wall, Friends network graph og Mutual friends network graph.

Denne dataen kan du hente i følgende format:

Plain text, csv, dot, xml, json, nodebox/py, guess/gdf eller graphml.

Så her kan du hente ned veldig mye, og se på det du vil. Det jeg vil se videre på og syns var mest interessant er mutual friends network graph, eller nettverk av felles venner. Jeg lastet ned dataen i csv, noe som gjorde det enkelt å importere dataen til Gephi.

Først importerer du csv filen som en ikke-rettet graf og du får en ganske uoversiktlig graf. Fra layout på venstre side velger du filter og «Yifan hu» som er en algoritme for å gruppere noder. Deretter velger du «Expansion» med en skaleringsfaktor på 1.5. Nå begynner grafen og ta form. Videre kan vi rangere størrelsen på hver node etter antall kanter de har ut fra seg, ved å velge «Ranking» og bruke parametere som «min size = 6» og «max size = 50» for en grei skalering. Deretter kan du bruke brush tool til å fargelegge en node og dens nærmeste naboer.

img2
Vi ser at grafen deler seg i forskjellige grupperinger En fra tidligere skolegang(grønn), en fra militæret(rød), en fra universitetet(gul), en fra en tidligere fritidsaktivitet(lyseblå) og en spredt gruppering som er familie, venner og venners venner jeg omgåes med på fritiden, jobb og litt forskjellig som gjør at kantene går litt på kryss og tvers(den blå delen). Svart node er meg.

Ved å velge «Topology->degree rank» kan man redusere grafen til å kun vise noder med en valgt mengde kanter. Dette kan igjen brukes for å se etter triadisk lukking i grafen hvor styrken til en kant måles etter hvor mange felles venner to noder med en kant mellom seg har. Jo flere felles venner to noder har, jo sterkere en kanten som går mellom dem. Vi begrenser oss i denne grafen til sterke og svake kanter, hvor en sterk kant er når to noder med en kant mellom seg har mer enn 100 felles venner. Ellers anser vi en kant som en svak kant hvis to noder med kant mellom seg har mindre enn 100 felles venner. Til å begynne med ser vi på de personene med mer enn 140 felles venner med meg. Det dukker da opp 6 noder, og alle er fra den grønne grupperingen.
img3
Vi ser at denne delgrafen tilfredsstiller triadisk lukking. Etterhvert som vi øker størrelsen på grafen kan dette være vanskelig å se når det blir mange kanter, men da kan vi bruke verktøyet «network diameter». Hvis det verktøyet retunerer noe annet enn 1, så er det en node som ikke tilfredsstiller triadisk lukking. Ved å endre parameteret til antall felles venner til å vise alle med mer enn 137 felles venner, dukker det opp en node til, som også tilfredsstiller også triadisk lukking. Neste nivå er alle med mer enn 135 venner, hvor det dukker opp ytterlige 3 nye noder, der det er en som ikke tilfredsstiller triadisk lukking. Alle nodene i disse delgrafene kommer fra samme gruppering, nemlig den fra tidligere skolegang. Dermed er det ikke så rart at veldig mange har kanter til hverandre.
Men en skulle tro at de med høyest grad av kanter var de jeg omgikk med mest på fritiden. Det er faktisk ikke tilfelle. Bare 1 av 10 vennene er venner jeg omgåes med og har jevnlig kontakt med (Markert som rød node). Dette var litt overraskende. Jeg hadde trodd at det skulle være flere av vennene jeg har jevnlig kontakt med skulle være i denne grafen. En mulig årsak til dette, tror jeg er at de som dukker opp i denne delgrafen legger til og blir lagt til av mange på Facebook. Noen av de som er i denne grafen under har oppunder 1000 venner, og det er nok det som gjør at antallet felles venner øker.
img4
Kilder:

http://givememydata.com/

https://www.facebook.com/help/131112897028467