Lexikon

Big Data

Was ist Big Data?

Der englische Begriff Big Data steht per Definition für eine große Menge komplexer, unstrukturierter und veränderlicher Daten. Mit traditionellen Methoden der Datenverarbeitung lassen sich diese Datenmengen nicht auswerten. Vielmehr sind hierfür spezielle Analysetechnologien erforderlich.

Inhaltsverzeichnis

  1. Wie funktioniert Big Data?
  2. Wie lässt sich Big Data verarbeiten?
  3. Big Data: Beispiele
  4. Welche Vorteile und Nachteile hat Big Data für Unternehmen?

Wie funktioniert Big Data?

Big Data entsteht in einer zunehmend digitalisierten Welt von allein. Tagtäglich werden neue Informationen generiert, was wiederum zu einer stetigen Zunahme der Datenmengen führt. Unter anderem stammen die Daten aus folgenden Quellen:

  • Nutzung von Internetdiensten und Social Media
  • Elektronische Kommunikation (insbesondere über Smartphones)
  • Nutzung von Bezahlsystemen
  • Elektrogeräte (z. B. Wearables wie Smart Watches)
  • Vernetzte Anlagen in der Industrie
  • Vernetzte Haustechnik
  • Vernetzte Fahrzeuge

Die Analyse dieser Daten im Rahmen von Business Intelligence ist nicht nur aufgrund des hohen Volumens schwierig, sondern auch aufgrund der zahlreichen unterschiedlichen Strukturen (Formate). Erschwernd kommt hinzu, dass sich Big Data im Regelfall schnell verändert.

Wie lässt sich Big Data verarbeiten?

Traditionelle (relationale) Datenbanken und Auswertungssysteme sind nicht in der Lage, Big Data zu verarbeiten. Vielmehr sind für die großen Datenmengen neue Lösungen für die Datenspeicherung und -analyse notwendig. Insbesondere unterscheidet sich Big Data Software durch folgende Aspekte von herkömmlichen Systemen wie Data Warehouses:

  • Parallele Verarbeitung vieler Daten möglich
  • Sehr schneller Import von Daten (teils sogar in Echtzeit bzw. Near-Real-Time)
  • Schnelle Suche und parallele Abfrage der Daten
  • Auswertung unterschiedlicher Informationstypen möglich

Aus technischer Sicht sind es In-Memory-Datenbanken oder Ansätze wie MapReduce (bekannt durch MongoDB und Apache Hadoop), mit denen sich diese Anforderungen umsetzen lassen.

Da sich Zusammenhänge in Big Data keineswegs mehr manuell erkennen lassen, wird zunehmend Machine Learning eingesetzt. Dieser Ansatz aus dem Bereich der künstlichen Intelligenz ermöglicht es unter anderem, nützliche Informationen, versteckte Muster und bisher unbekannte Korrelationen in den Daten zu identifizieren.

Aufgrund der enormen Rechenressourcen, die für Big Data Analytics erforderlich sein, setzen immer mehr Unternehmen auf ein Daten-Management via Cloud Computing. Sie halten also die notwendige Hard- und Software nicht im eigenen Hause vor, sondern greifen via Internet auf Big-Data-Lösungen zu.

Big Data: Beispiele

In Unternehmen lassen sich Big Data Analytics mittlerweile vielfältig einsetzen. Nur einige Anwendungsbeispiele sind:

  • Industrie: Auswertung von Sensordaten aus Maschinen und Anlagen für die Instandhaltung und das Qualitätsmanagement
  • Analyse des Verhaltens von Kunden im Internet, Realisierung personalisierter Angebote
  • Analyse und Prognose von Marktveränderungen (z. B. anhand von Stimmungen in sozialen Netzwerken)
  • Optimierung der Routenplanung in der Logistik
  • Betrugserkennung

Welche Vorteile und Nachteile hat Big Data für Unternehmen?

Aufgrund von Cloud Computing ist Big Data nicht länger ein abstrakter Begriff. Vielmehr sind die Analytics-Technologien hierdurch wirtschaftlich einsetzbar und können zahlreiche Vorteile für Unternehmen mit sich bringen. Im Segment der Business Intelligence kann entsprechende Software beispielsweise fundierte Informationen für Management-Entscheidungen zur Verfügung stellen. Auch ermöglichen die Technologien ein frühzeitiges Erkennen von Trends sowie die Entwicklung neuer Services und Geschäftsmodelle.

Eine wesentliche Herausforderung im Big-Data-Umfeld ist jedoch der Datenschutz. So haben Unternehmen mittlerweile die Möglichkeit, tiefe Einblicke in das Verhalten und die Privatsphäre von Menschen zu erlangen. Aus Anwendersicht ist hierbei insbesondere die Nachvollziehbarkeit problematisch. So ist beispielsweise kaum einem Internet-Nutzer vollständig klar, welche seiner Daten von wem und wie lange gespeichert werden.

Nicht zuletzt stellt Big Data ein attraktives Betätigungsfeld für Hacker dar. Viele Unternehmen speichern ihre Daten in der Cloud. Insbesondere bei verteilten Systemen, bei denen sich die Server überall auf der Welt befinden können, ist der Datenschutz eine hohe Herausforderung.

Autor dieses Artikels ist Ertan Özdil, CEO, Gründer und Gesellschafter des Cloud ERP-Anbieters weclapp.

Bitte beachten Sie die rechtlichen Hinweise zu diesem Artikel.