Hvem bruker data i dag – og hvordan
Politikere, politiet, offentlige myndigheter og nasjonale sikkerhetsmyndigheter. Forsvaret, forskere og finansfolk. Sportsklubber, TV-kanaler, produksjons- og industriforetak. For alle disse og mange andre er data allerede essensielt. Og i det som i en økende grad er et datafisert informasjonssamfunn, kommer de fleste til å jobbe med data og bruke data på et eller annet nivå.
Kjernekompetanse i databruk trengs kanskje aller mest blant dem som jobber i tilknytning til samfunnskritisk infrastruktur. Men det er på ingen måte begrenset til det. Aktivister, markedsførere, selv bønder jobber stadig mer datadrevet – smart landbruk er allerede i høyeste grad en ting.
Mer data – bedre tjenester
Det er ingen tvil om at data bare vil bli viktigere og viktigere i folk flests liv og arbeidshverdag. I en stortingsmelding fra 2021 står det at «Regjeringen vil at Norge skal utnytte mulighetene som ligger i data til økt verdiskapning, flere nye arbeidsplasser i hele landet og en effektiv offentlig sektor».
Konkrete tiltak fra regjeringens side er å inngå internasjonale samarbeid på tvers av Norden og EU og kompetansehevinger i utdanningsinstitusjoner og næringslivet. Men en av de største satsningene er å styrke tilgangen til data.
Offentlig sektor innhenter, produserer og lagrer enorme mengder data. Data om hvor vi bor og hva vi jobber med – men også om vær, geografi, og informasjon om trafikk og samferdsel.
Hva brukes data til?
Samfunnet er blitt mer og mer komplekst med tiden. Fra et sosiologisk perspektiv kan vi kanskje si at digitaliseringen er en måte å håndtere denne kompleksiteten på: Vi trenger digital teknologi rett og slett for å finne oss til rette i en så kompleks verden som vi befinner oss i. For eksempel har det vært en stor vekst innen teknologi som er i stand til å samle inn og prosessere store mengder data.
Selv om vi kanskje ikke tror det, så er både individer og samfunnet i seg selv veldig rutinebaserte. Vi har mange individuelle og kollektive vaner og handlingsmønstre som kan avdekkes, blant annet gjennom å analysere stordata ved hjelp av maskinlæring og andre teknikker.
Stordata: Fem kjennetegn og fem utfordringer
Det genereres og samles stadig inn nye data om oss alle. I alle mulige sammenhenger. Drivere for økte datamengder inkluderer blant annet internett, tingenes internett (Internet of Things, IoT), nettskyen og sosiale medier.
Stordata er datamengder som er så store, mangeartede eller komplekse at vi mennesker ikke alene har kapasitet til å analysere, forstå og gi dem mening. I stedet bruker vi teknologier som maskinlæring for å skape orden og finne mønstre i dem.
Nedenfor kan du lese om fem kjennetegn ved stordata – og fem utfordringer de skaper for ledere.
Teknologien hjelper oss med å finne hemmelighetene som gjemmer seg i disse stordataene: Vi kan få mer kunnskap om hvordan vi kan koordinere og organisere oss bedre. Vi kan støttes i å finne løsninger på komplekse utfordringer, for eksempel innen klima og miljø.
En som er ekspert på å hente ut disse innsiktene og skape verdi fra data, kalles en data scientist.
Data science
Nå har vi sett litt på hvem som bruker data, og det viser seg å være ganske mange! Det finnes derimot også et helt spesifikt fagområde om data. Det heter data science.
Som vi har nevnt tidligere i kapittelet er uttrykket data science forvirrende for mange. Siden uttrykket dukket opp en gang på 80-tallet har tittelen data scientist i mange tilfeller blitt brukt som et alternativt navn for statistikere og informatikere.
I den digitale tidsalderen, hvor data nå anses som vår fremste ressurs, favner derimot uttrykket bredere.
Innsikt
Hva gjør en data scientist?
Data science kombinerer statistikk, programmering, dataanalyse, algoritmer og forretningsinnsikt i et tverrdisiplinært fagområde.
I bunn og grunn kan data science forklares som kunsten å bruke alle (vitenskapelige) metoder, prosesser og verktøy man har i verktøykassa for å strukturere, analysere og tilgjengeliggjøre data – for å bruke disse dataene til å oppnå et bestemt mål. Akkurat på samme måte som naturvitenskap handler om å forstå naturen og naturlige fenomener ved hjelp av biologi, kjemi, fysikk, geologi og så videre.
En data scientist er dermed en ekspert på å strukturere data og hente ut datadrevet innsikt og å skape for eksempel automatiseringer og bedre arbeidsflyt ved hjelp av data.
Om du setter deg ned med en data scientist en hel arbeidsdag, vil du sannsynligvis se en person som først og fremst jobber med koding og programmering med den hensikt å hente ut, analysere, tolke og sette data i system for en virksomhet.
Selvsagt kan en bruke data science-ferdigheter både til private, politiske, frivillige og andre aktiviteter. Det finnes mange eksempler på at data brukes til å for eksempel optimalisere trening og kosthold. Om du har et Fantasy Premier League-lag på kontoret, kan du faktisk bruke data science for å bygge et lag, og ta innersvingen på kollegaene dine.
Men når vi snakker om data science mener vi typisk hvordan det brukes i offentlige og kommersielle sammenhenger.
I de fleste bransjer har man data om salg, innkjøp, lager, finans, kunder, ordre, transport, vedlikeholdsinformasjon, utstyrsdata og data fra leverandører, for å nevne noe. Industribedrifter har i tillegg driftsdata, som kommer fra industrielt utstyr, maskiner, prosesser og systemer under drift.
For å hente innsikter og skape verdi ut av disse dataene, er det flere ting som må skje.
For det første må du vite hva som er målet og hvilke grunnleggende problemer du skal bidra til å løse. Deretter må du hente inn og strukturere dataene. Å finne, samle inn, rydde opp i og organisere de relevante dataene kan være svært tidkrevende og omstendelig arbeid – typisk rundt 80 prosent av jobben i et gitt prosjekt, målt i tid og innsats. Du vil lære mer om alle disse tingene i kapittel 3-5.
Når du til slutt sitter med ferdig forberedte og brukbare data, starter selve moroa – nemlig å lage maskinlæringsalgoritmer eller «modeller» som kan brukes for å finne mønstre i dataene og for eksempel anvende dem i beslutningsstøtte. Hva har skjedd? Hvorfor skjedde det? Hva kommer til å skje, når vil det skje og hvorfor? Hva bør vi gjøre med det som skjer? Alt dette er ting modellene kan hjelpe til med å finne svar på.
For å få til alt dette, må en data scientist for det første forstå teknologien. For det andre kreves det en god forståelse av bransjen bedriften jobber innenfor – det vi kaller domenekunnskap. Kombinasjonen av teknologi- og domenekunnskap gjør det mulig å se hvordan man kan bruke data til å ta bedre beslutninger og effektivisere bedriften.
I dag er data science en spesialisert disiplin – men i stadig større grad blir den nødvendige kunnskapen og verktøyene gjort mer tilgjengelige for ikke-spesialister.
Stadig utvikles det også programvarer som gjør det enklere for folk flest å forstå data, uten selv å ha studert programmering og IT i flerfoldige år. Denne «demokratiseringen» av data skal vi komme tilbake til når vi snart skal komme inn på det som kalles data literacy. Men først skal vi se nærmere på noen muligheter og utfordringer som oppstår ved bruk av data.