Hvordan kvalitetssikrer og klargjør vi data?
Data må kvalitetssikres og ryddes i.
Dette kan selvsagt gjøres manuelt. Ja, omtrent all databehandling kan gjøres manuelt, inkludert å sjekke opphav og pålitelighet, fullstendighet og korrekthet, konsistens og format – samt masse annet. Men manuelt arbeid er tungvint, upraktisk og rett og slett ganske gammeldags. Og i tilfeller med enorme datasett – nær sagt umulig.
Organiserer du dataene i en database med en kjent og vellaget datamodell, vil de både være enklere å få tilgang til, sikrere lagret og betydelig mindre arbeidskrevende å sammenstille og holde styr på. Nøyaktig hvordan dette skjer – og hvordan SQL, en variant av programmeringsspråk, brukes for å jobbe med data – skal vi nå se nærmere på i neste seksjon.
Men la oss først se hva du har fått med deg: