Hva er Big Data?

Big Data er et store mender data som samles inn og analyseres slik at vi får en ny innsikt i det som jobbes med. Dette gir oss ny innsikt fra data som vi ikke har hatt mulighet til å tilgang til tidligere eller som kan ha blitt oversett. Noe av det som særpreger Big Data er volumet, at det endres hele tiden, troverdigheten, stor verdi og fullstendighet av informasjonen som finnes der.

Grunnlaget for Big Data er prosesskraften, lagringskapasitet, rekke nettverk, allestedsnærværende (i form av klokker, IoT og mange andre enheter) og standardiserte identifikasjoner (personnummer, IP-nr, MAC-adresse, førerkort, o.l.)

Data til Big Data samles inn via spor fra teknologibruk, skytjenester, nettransaksjoner, medisinsk/helseutstyr, kunde-/klientregistrering, områdeovervåkning, ansiktsgjenkjenning og mange flere kilder. Det at data samles inn på så mange måter gjør at det blir svært mye informasjon som kan brukes til og tilføyes i Big Data.

Hvordan brukes Big Data?

Det å bruke Big Data har mange fordeler i form av at dataen som blir samlet inn kan brukes til å lage prognoser, for eks. i sammenheng med bemanning, lage algoritmer for prediksjon, forebygge sykdommer, for eks. influensa og til å forebygge/bekjempe kriminalitet. Mens noen problemer og ulemper med bruk av Big Data er at det skaper en risiko for misbruk som skaper sårbarhet i form av at registrene over voldsofre/overgripere, misbrukere og lignende er åpne. Det at personlig informasjon kan bli misbrukt, det kan føre til diskriminering, datainnbrudd og politisk manipulering.

Big Data blir brukt mye blant internettbaserte selskaper som bruker disse dataene til markedsføring, men dataene blir også brukt til å forbedre søkealgoritmene på de ulike nettsidene og søkemotorene.

De fem V-ene

Innenfor Big Data er det hovedsakelig tre V-er som brukes til å beskrive hva dette er; det er Volum, Velositet (hastighet) og Variasjon. Volum er mengden på data som er brukt i Big Data. Det har blitt satt nye og strengere krav innen dette feltet i forhold til behandling av data, lagring og overføring. Velositet vil si at dataen som blir brukt må analyseres svært raskt da dette skjer i sanntid. Siden det ikke er all data som blir lagret i sin helhet så er det viktig at det som kommer inn av informasjon blir analysert i sanntid før resultatene så blir lagret. Variasjon viser til at informasjonen innen Big Data kommer fra mange ulike kilder som da gjør at dataen blir en blanding av mange ulike typer data.

Det er også to V-er som har blitt lagt til i senere tid; Veracity (troverdighet) og Verdi. Veracity viser til det at Big Data er satt sammen av så mye data fra mange kilder, noe som gjør det utrolig viktig å ha kontroll på hvilke kilder som er pålitelige og som kommer med nøyaktige og korrekte data. Verdi vil si at dataen innenfor Big Data må ha verdi mot det personlige, ideelle, kommersielle eller det samfunnsmessige.

Kilder:

Big Data – kilde til innovasjon og konkurransefortrinn

Hvordan brukes Big Data idag?