Dataenes livssyklus
Her har du tre tall: 27, 92 og 93.
Sier det deg noe? Neppe. Men så snart du vet at tallene viser til andelen nordmenn fra 9-79 år som brukte internett en gjennomsnittsdag i henholdsvis år 2000, 2020 og 2021, blir tallene mer interessante. Tenk, bare én av fire brukte nettet daglig i år 2000! Og fortsatt er ikke alle nordmenn på nett.
Poenget er at det gir liten mening å snakke om tilfeldige tall eller verdier som data. Data må representere noe, eller handle om noe, for å ha en verdi og kunne bli til informasjon og kunnskap. Eksempelet viser at data trenger kontekst.
Det eksempelet også viser, er at dataene har et opphav. Tallene er ikke hentet ut av luften, men har en forankring i en eller annen situasjon eller aktivitet. Det finnes noe forut for dem; de oppstår ikke ut av det blå. Dette gjelder også for eksempel analoge data slik som en lydbølge – det er noe som skaper lyden.
Dataene er altså uløselig knyttet opp mot de situasjonene de oppstod i eller angår, og det er derfor viktig å kunne relatere data tilbake til situasjon (kontekst) – hvis ikke risikerer man altså at dataene mister sin potensielle verdi. Slik kontekstuell informasjon både kan og bør reflekteres gjennom metadata, som betyr «data om data».
Dataene er altså uløselig knyttet opp mot de situasjonene de oppstod i eller angår, og det er derfor viktig å kunne relatere data tilbake til situasjon (kontekst) – hvis ikke risikerer man altså at dataene mister sin potensielle verdi. Slik kontekstuell informasjon både kan og bør reflekteres gjennom metadata, som betyr «data om data».
Fakta
Metadata
Metadata er data om data. For eksempel i galleri-appen på mobilen din kan du finne data om hvor og når et bilde er tatt, hvilke innstillinger som er brukt, antall piksler, filtype, filstørrelse og plassering på enheten. Alt dette er data som handler om bildet; det er altså data om data, eller metadata.
En annen måte å si det på, er at metadata er tilleggsdata som gir informasjon om tolkning av data.
Ordet «meta» er egentlig et prefiks som kommer fra gresk og betyr mellom, etter eller over. En metadiskusjon er eksempelvis en diskusjon om eller over en diskusjon; en metastudie legger sammen resultatene av tidligere studier; en metaverden er en verden over en verden. Det er ikke tilfeldig at selskapet Facebook – idet de planlegger en digital, syntetisk VR-verden – har skiftet navn til nettopp Meta.
For å forstå hvordan data fungerer, og hvordan det gir oss innsikt og lar oss gjøre nye ting, må vi følge dataenes egen reise. På veien blir de blir samlet inn, lagret, behandlet og analysert – og kanskje rapportert og visualisert – før de tas i bruk. Dette er dataenes livssyklus.
Denne modellen er basert på en internasjonalt etablert standard (definert av ISO, International Organization for Standardization) og er mye brukt i akademia og næringsliv. Men den kan også være aktuell for oss som privatpersoner når vi søker innsikt fra for eksempel treningsklokker og andre IoT-støttede enheter (IoT står for Internet of Things – tingenes internett).
I tillegg er den også relevant for eksempel med tanke på personvern. Da handler det om hvem som eier dataene, hvor lenge de beholder dem og hvilke formål de brukes til.
Hva livssyklusen er og hvordan den ser ut kan du utforske videre i boksene nedenfor.
Livssyklusen del 1 – fra situasjon til lagring
Klikk for å lese om de ulike stegene i første del av dataens syklus – fra dataene oppstår til de er samlet inn og lagret.
Livssyklusen del 2 – fra lagring til handling
Klikk for å lese om de ulike stegene i andre del av dataens syklus, fra lagring til handling.
Innsikt
Livssyklusen: Data lever – men dør ikke
Vi kaller dette dataenes livssyklus. Det er en god metafor – inntil et visst punkt. For livssyklusen til data har, i motsetning til et menneske, ingen renskåret start eller slutt. Data skapes, men det er ikke dermed sagt at de senere dør.
De kan gjøres inaktive, de kan neglisjeres og de kan bli mindre relevante. Men de er med på en kontinuerlig og pågående prosess der de utvikles, benyttes og gir grobunn for ny dataproduksjon. Og så lenge de lagres og tas vare på, kan de alltid hentes opp igjen og få ny betydning og verdi.
Ja, de er rett og slett «larger than life», for å si det med Backstreet Boys.
Erstatter du «love» med «data» i sangen deres med samme navn, er det egentlig nokså treffende for hvilken plass data har i verden i dag:
«All you people can't you see, can't you see. How your data's affecting our reality».