Hva er egentlig data?
Gamle kirkebøker, handelsregistre, blytunge telefonkataloger og musikkassetter inneholder massevis av data. Data er altså ikke noe nytt. Det fantes lenge før vi hadde datamaskiner og digitale data.
Likevel er det åpenbart noe nytt som skjer nå. For å forstå hva, må vi bli bedre kjent med hva data egentlig er.
Definisjoner
Hva er data?
Det finnes mange definisjoner av data, som passer i ulike sammenhenger. Ordet i seg selv er opprinnelig flertall av det latinske datum, som betyr «det som er gitt». I dag bruker vi det som oftest i betydningen «verdi», «opplysning» eller «råinformasjon» (i betydningen ikke-bearbeidet).
For å lene oss på definisjonen i Store norske leksikon, er data kort sagt opplysninger eller verdier som eksisterer i et eller annet bestemt format. De kan dermed lagres, overføres og prosesseres etter bestemte regler – slik at det blir forståelig og brukbart for en mottaker. For å kunne analyseres og anvendes, må dataene altså finnes i et dataformat som er lesbart og forståelig for mennesker og/eller maskiner.
Data kan være analog eller digital. Hva som teknisk sett er forskjellen, vil du lære om i neste kapittel. Den enkle forklaringen er likevel at digitale data er data som kan leses og brukes av datamaskiner.
Hvordan ser data ut?
Se for deg et Excel-ark med en tabell som viser rad på rad med tall – for eksempel som representerer temperaturer på et bestemt sted fra dag til dag.
Ut ifra dette vil en kyndig Excel-bruker kunne trykke på noen knapper og trylle frem en graf som visualiserer temperaturen på dette stedet. Denne typen tabeller og visualiseringer er det mange typisk forbinder med data.
Dette er riktig, men data er også mye mer enn bare tall og tabeller. Det finnes mange ikke-numeriske former for data – som observasjoner, fotografier, bokstaver, symboler, bilder, lyd, elektromagnetiske bølger og så videre.
Data er heller ikke alltid pent og pyntelig sortert som i det tenkte Excel-arket vårt. Her har vi strukturerte data (dette gjelder ting som lister og tabeller, kirkebøker og handelsregistre), men data kan også være ustrukturerte (for eksempel tekstdokumenter, bilder og musikk). Og de kan finnes i en rekke ulike formater. Hva alt dette innebærer og hva slags dataformater som finnes, vil du lære mer om senere.
Selv om du hører ord som «råinformasjon», er det viktig å understreke at data aldri egentlig er «rå» eller «nøytral». Vi abstraherer virkeligheten med data: Vi bruker det til å lage representative kategorier og målinger av verden rundt oss og oss selv. Hvordan denne representasjonen blir seende ut er alltid påvirket av hvem som samler dataene, og av hvordan de samles, analyseres og tas i bruk.
Data må dessuten settes i kontekst, og så tolkes og etterprøves, før det kan kalles informasjon eller kunnskap. Akkurat dette skal vi med en gang se litt nærmere på.
Data vs. informasjon vs. kunnskap
Data er ikke helt det samme som informasjon eller kunnskap, selv om alle disse henger tett sammen. Enkelt sagt er det først når dataene tolkes og settes i kontekst – altså tillegges en mening eller betydning – at de blir informasjon.
I neste omgang kan vi lene oss på data og informasjon for å tilegne oss og utvikle kunnskap. Kunnskap kan igjen danne et grunnlag for visdom.
Du kan se på dette som fire nivåer:
Si for eksempel at du ønsker å vite om det i gjennomsnitt er kaldest hjemme hos deg eller hos vennen din. Da trenger du for det første data: avlesninger av hvert deres termometer, værmeldinger og statistikk for hvert område. Kanskje vil du sammenligne strømregninger. Og vennen din som forteller at hun hakker tenner i kulden – det er også data.
For det andre må du sortere disse dataene og sette dem i kontekst. For eksempel kan du sortere avlesninger av termometer fra hvert sted over et bestemt tidsrom og tegne det opp som en graf. Dette vil gi deg informasjon.
For å være sikker på svaret, bør informasjonen faktasjekkes og etterprøves. Kanskje finnes det andre data som kan gi den samme informasjonen, slik at du kan sammenligne og bekrefte resultatene. Har du gode nok data, kan du snart sette to streker under svaret.
I dette eksempelet finnes det nok et fasitsvar. Mye av det vi ønsker å finne ut i den virkelige verden er litt mer komplisert. Kunnskap – og visdom – er da resultatet av et vedvarende informasjonssøk, tolkninger og argumentasjonsarbeid; den er alltid i bevegelse. Kunnskap påvirkes av kontekst, den er kompleks, og den opparbeides først over tid, gjennom langvarig arbeid og erfaring. Den kan lene seg på mange ulike kilder til informasjon – som igjen kan komme frem fra mange forskjellige data.
Data som råvare
Stadig mer av det vi gjør involverer enten digital teknologi direkte (for eksempel internett, apper, digitale enheter), eller fanges på andre måter opp og genererer digitale data (for eksempel kameraer, sensorer, IoT-enheter). Dette gjelder både for hver av oss som individer, og det gjelder i samfunnet, industrien og næringslivet som helhet.
Alle disse dataene som er i omløp er ikke bare interessante i ettertid – for dem som vil gjøre et høyteknologisk detektivarbeid på jakt etter verdifull informasjon og kunnskap i alle de digitale sporene. Dataene tas også direkte i bruk, i nåtid.
Data kan altså på den ene siden sees på som råinformasjon. På den andre siden kan det sees på som en råvare som former de digitale produktene og tjenestene som omgir oss. De mates inn i algoritmene som styrer de digitale tjenestene vi bruker hele tiden.
Algoritmer
Algoritmer er noe vi hører om stadig vekk. Men hva er det egentlig? Her får du svar.
Data og datasystemer
Vi tar med én siste avklaring her, før vi går videre. Du vil en del ganger i kurset møte begrepet «datasystem». Hva menes egentlig med det? La oss igjen låne en definisjon av SNL:
«Datasystem er én eller flere datamaskiner, programvare og annet datautstyr som jobber sammen i et digitalt kommuniserende økosystem. Et datasystem kan også omfatte IoT-enheter.»