Lexikon

Data Mining

Was ist Data Mining?

Data Mining bezeichnet die systematische Nutzung computergestützter, statistischer Methoden zur Identifizierung von Mustern, Zusammenhängen und Trends in umfangreichen Datenbeständen (Big Data). Die hierfür eingesetzten Algorithmen kombinieren Erkenntnisse aus der IT, der Mathematik und der Statistik.

Inhaltsverzeichnis

  1. Wie funktioniert Data Mining?
  2. Welche Data-Mining-Methoden gibt es?
  3. Warum braucht man Data Mining
  4. Anwendungsbeispiele
  5. Welche Vorteile hat Data Mining?
  6. Risiken von Data Mining

Wie funktioniert Data Mining?

Data Mining ist ein interdisziplinäres Betätigungsfeld. Es nutzt Erkenntnisse aus der Informatik, der Mathematik und der Statistik, um große Datenmengen zu analysieren. Die Rede ist hierbei auch von Big Data Analytics. Unter anderem werden Verfahren der künstlichen Intelligenz (KI) wie Machine Learning (ML) verwendet, um innerhalb von Big Data neue Muster, Trends und Querverbindungen zu identifizieren.

Data Mining ist ein Teil des sogenannten Knowledge-Discovery-in-Databases-Prozesses. Dieser Prozess dient der Wissensentdeckung in Datenbanken und läuft grob skizziert in folgenden Schritten ab:

  1. Fokussierung: Datenerhebung, Definieren von bereits vorhandenem Wissen
  2. Vorbereitung: Bereinigung der Daten
  3. Transformation: passendes Format für Analyse herstellen
  4. Data Mining: Durchführung der Analyse
  5. Evaluation: Überprüfung der identifizierten Muster durch Experten, Zielkontrolle

Welche Data-Mining-Methoden gibt es?

Allgemein sind vier Data-Mining-Methoden zu unterscheiden:

Data-Mining-MethodeBeschreibungAnwendungsbeispiel
KlassifikationSuche nach Mustern anhand bestimmter MerkmaleVorhersage von Produktaffinitäten eines Kunden
PrognoseSuche nach Mustern einer definierten ZielvariablePrognose des Umsatzes im kommenden Monat
Gruppierung (Segmentierung & Clustering)Identifizieren von Segmenten und Gruppen in DatenKundensegmentierung zur zielgenaueren Ausrichtung von Marketingmaßnahmen
Abhänigkeitsentdeckung (Assoziation & Sequenz)Suche nach Zusammenhängen und Abhängigkeiten in Daten in Form von RegelnWarenkorbanalyse im Online-Handel

Warum braucht man Data Mining?

Data Mining unterstützt Unternehmen dabei, extrem große Datenmengen zu analysieren, welche mit herkömmlichen Methoden – etwa in klassischen Business Intelligence Tools – nicht auswertbar wären. Die Ergebnisse der Analysen helfen dem Management und Führungskräften dabei, fundierte Entscheidungen zu treffen.

Anwendungsbeispiele

Eingesetzt werden Data-Mining-Verfahren mittlerweile in zahlreichen Branchen und Unternehmensbereichen:

  • Handel: Die Modelle eignen sich dazu, das Kundenverhalten zu analysieren und das zukünftige Kaufverhalten zu prognostizieren.
  • Marketing: Ein wichtiger Anwendungsbereich ist die Personalisierung im Marketing – also eine exakt auf den einzelnen Kunden zugeschnittene Kommunikation mit hohem Automatisierungsgrad.
  • Versicherungen & Banken: Sie nutzen Data-Mining-Verfahren hingegen zum Beispiel, um Risikoanalysen durchzuführen.
  • Text Mining: Hier werden Informationen und Muster aus Textdaten gewonnen. Ein häufiger Anwendungsfall ist, dass aus Texten schnell relevante Informationen herausgefiltert werden können.

Welche Vorteile hat Data Mining?

  • Höhere Kundenorientierung
  • Genaue Zukunftsprognosen
  • Erschließung bisher verborgener Informationen in Daten (Big Data)
  • Frühzeitige Erkennung von Trends und Anomalien
  • Datenbasierte Stützung von Entscheidungen
  • Optimierung und Automatisierung von Geschäftsprozessen
  • Maschinelle Verarbeitung von Bildern und Texten

Risiken von Data Mining

Data Mining und seine vielfältigen Möglichkeiten bietet immer wieder Diskussionsstoff. Folgende Punkte stehen dabei in der Kritik:

  • Fehlende oder falsche Daten führen zu falschen Ergebnissen
  • Komplexe Algorithmen und Datenmengen führen zu langen Laufzeiten
  • Datenschutz und Datensicherheit muss gewährleistet sein
  • Die abhängigen und unabhängigen Variablen, Klassen und Analysetechniken werden manuell festgelegt und sind deshalb durch Annahmen und Zielvorstellungen verfälscht

Autor dieses Artikels ist Ertan Özdil, CEO, Gründer und Gesellschafter des Cloud ERP-Anbieters weclapp.

Bitte beachten Sie die rechtlichen Hinweise zu diesem Artikel.