Teknologi og sånn
Bra jobba! Du er ferdig med kapittel 2!
La oss knytte det vi har lært mot data-livssyklusen.
Vi har sett at det kan genereres data om oss når vi er i mange ulike situasjoner, grunnet blant annet internett, tingenes internett (for eksempel i forbindelse med smarte byer) og sosiale medier. Mange enheter rundt oss fungerer nå som datamaskiner – ikke bare PC-er og tjenermaskiner (servere), men også mobiltelefoner, digitale kameraer, smarte TV-er, klokker, høyttalere og så videre.
De genererte dataene kan da samles inn og lagres, på lavere nivå som bits på et medium som en harddisk eller SSD – men også på et høyere nivå som i en database eller tekstfil.
Når dataene er samlet inn og lagret kan de behandles og prosesseres – det kan for eksempel være at de trenger å filtreres, renses eller transformeres, noe som kanskje er spesielt relevant for ustrukturerte data. I tillegg skjer det også en prosessering når dataene tas i bruk gjennom andre applikasjoner eller dataprogrammer.
Med data, og spesielt store datamengder, ønsker man gjerne å analysere dataene. Det kan være alt fra enkle statistiske analyser, til mer kompliserte analyser som er basert på kunstig intelligens og maskinlæring. Visualisering av analyseresultatene kan gi et bedre grunnlag for tiltak og beslutninger, siden det kan gjøre det enklere å tolke resultatene av analysene. Det å ta beslutninger basert på store data, og analyser av store data, kan, som vi har sett, være en utfordring.
Når datamengdene blir så omfangsrike, er det uhyre viktig å være bevisst sikkerhetsrisikoene som følger med. Cyberkriminelle tar i bruk svært mange verktøy og metoder for å få tak i data om deg og arbeidsgiveren din. Ansvaret for å beskytte oss selv og omgivelsene våre fra dataangrep bør ligge langt fremme i bevisstheten.
Et annet viktig perspektiv, som vi vil se på, er at det ofte er data om oss selv som genereres, samles inn, lagres, og så videre – av andre enn oss selv eller firmaet vårt.