Big Data

Big Data, zu Deutsch Massendaten, bezeichnet eine große Menge an strukturierten und unstrukturierten Daten, die in einem Unternehmen anfallen. Dabei handelt es sich um Daten, welche beispielsweise zu groß, zu komplex, zu schnelllebig oder zu schwach strukturiert sind, um sie mit manuellen und üblichen Methoden der Datenverarbeitung auszuwerten.

Das Big in Big Data bezieht sich auf vier Dimensionen (die 4 V’s ):

Volume
Umfang und das Datenvolumen. Dazu gehören u.a. Daten wie geschäftliche Transaktionen, IoT, Industrieanlage, Videos, Social Media.

Velocity
Geschwindigkeit, mit der Datenmengen generiert und transferiert werden. Datenmengen von RFID-Tags, Sensoren und Smart Metering fallen in diese Kategorie und werden nahezu in Echtzeit bewältigt.

Variety
Bandbreite der Datentypen und Datenquelle. Strukturierte, semi-strukturierte und unstrukturierte Daten beschreiben die variety. Ca. 90% der gespeicherten Daten sind unstrukturiert und werden von Datenbanken oftmals gar nicht ausgewertet. Durch Big Data werden diese anhand Machine Learning analysierbar.

Veracity
Echtheit der Daten. Daten kommen aus verschiedenen Quellen teilweise nicht in der gewünschten Qualität an und können daher nicht wie gewollt eingesetzt werden oder müssen aufwendig nachbereitet werden.