Studie naar Big Data

21-01-2015 De term ‘Big Data’ wordt te pas en te onpas gebruikt. Maar wat is het nou eigenlijk? En belangrijker, welke standaards zouden ervoor moeten komen? Een ISO studiegroep rapporteerde onlangs over Big Data.

De term ‘Big Data’ beschrijft een nieuw paradigma rond data applicaties. Nieuwe technologieën komen maar al te vaak als een hype, waardoor het lastig kan zijn om goed te kunnen onderscheiden wat er nou nieuw en anders is. Big Data is op veel manieren gedefinieerd, maar de kern is dat het te veel is, te snel komt, te snel verandert, te veel ruis bevat, of een te grote variëteit bevat om te kunnen worden verwerkt met een eigen computerstructuur met een traditionele aanpak en technieken.

De technieken die worden geïntroduceerd om deze samenhang wel te ondersteunen, hebben een breed scala aan interfaces, waardoor het moeilijk wordt om tools en applicaties te maken die gegevens van verschillende Big Data-bronnen kunnen integreren. Een onlangs verschenen rapport van een ISO studiegroep (‘ISO/IEC JTC 1 Study Group on Big Data’) richt zich op de mogelijke gebieden voor standaardisatie binnen de technologie van Big Data.

Definitie

Volgens de studiegroep is er sprake van Big Data, wanneer de gegevensstromen dwingen tot een nieuwe systeemarchitectuur; van de traditionele monolitische systemen die verticaal schalen, naar een horizontaal schalend systeem, waarin onderling min of meer gekoppelde bronnen zijn geïntegreerd. Hierdoor kunnen in plaats van maar een deel, complete datasets worden geanalyseerd, of een continue stroom van data in real-time. Uiteindelijk werd er een werkdefinitie van Big Data geformuleerd; ‘Big Data is a data set(s) with characteristics (e.g. volume, velocity, variety, variability, veracity, etc.) that for a particular problem domain at a given point in time cannot be efficiently processed using current/existing/established/traditional technologies and techniques in order to extract value.’

Rapport

Het rapport onderkent vervolgens nog de belangrijkste redenen waarom organisaties Big Data zouden toepassen, en bespreekt de belangrijkste karakteristieken van Big Data (volume, velocity, variety, veracity en variability). Verder doet het rapport aanbevelingen rond het implementeren van Big Data, en onderscheidt een reeks van deelgebieden waarop standaardisatie zou kunnen plaatsvinden. Het advies wordt gegeven om een nieuwe werkgroep op te richten die dat gaat uitvoeren.

Eerder door u bekeken

Meer informatie

Nederlandse bedrijven of overheden die betrokken willen zijn bij de ontwikkeling van ISO normen voor Big Data kunnen contact opnemen met Gertjan van den Akker.

(015) 2 690 426

gertjan.vandenakker@nen.nl

Ook interessant voor u