Big Data – von der catch Phrase zum Industrie-Standard


 

Was ist Big Data?

Mittlerweile ist Big Data zum Standard geworden. In aller Munde, aber wissen alle, die darüber reden oder davon hören was es bedeutet? Grundlegend: Einfach eine riesengroße Menge an Daten. Größer als eine einfache Tabellenkalkulation fassen kann.

Big Data bedeutet am Ende nichts anderes als das groß angelegte Erheben, Speichern und Analysieren von Daten. Zugegeben etwas stark vereinfacht.

Viele weiter gehende Definitionen sind eher vorsichtig zu betrachten. Sie sind eher Bestandteile von Projekten, die sich mit Daten beschäftigen. So zum Beispiel Datenvisualisierung. Doch Visualisierung spielt auch bei anderen Vorgehensweisen ohne Big Data eine Rolle.

Was macht Big Data aus? Die Kennzeichen

Muster und Strukturen innerhalb der Daten sind der Kern, einzelne Datensätze spielen eher eine untergeordnete Rolle. Big Data besteht unter anderem aus unterschiedlichen Datentypen und unstrukturierten Daten.

Hauptsächlich lassen sie ein paar Merkmale festhalten:

Die große Datenmenge: Je mehr Daten, umso ein besseres Bild über die Wirklichkeit.

Big Data besteht zumeist aus unterschiedlichsten Datentypen und äußerst komplexen Datensätzen (Datenvarietät). Das lässt Zusammenhänge und Muster erkennen. Die Herausforderung: Daten miteinander in eine sinnvolle Beziehung zu bringen.

Die Geschwindigkeit der Datenverarbeitung: Daten stehen heute oft schon in Echtzeit zur Verfügung. Dies wird heute und in Zukunft einer der wichtigsten Wettbewerbsvorteile.  Schnelligkeit gewinnt.

Daten müssen schnell veränderlich sein. Die Bedeutung von Daten verfällt zusehends. Daten müssen darum veränderlich sein bzw. immer wieder neu erhoben werden, um weiterhin relevant zu sein. Alleine Verkehrsdaten ändern sich sekündlich und das auch noch in Abhängigkeiten von Baustellen, Ferien etc.

Visualisierung ist der Wettbewerbsvorteil

Um Entscheidungen treffen zu können, müssen Daten übersichtlich und verständlich dargestellt werden. Das ist einer der zentralen Faktoren für den Erfolg von Datenprojekten und Projekten im Allgemeinen. Denn Entscheidungen werden in der Regel nicht von Datenspezialisten getroffen.  Wettbewerbsvorteile entstehen dann, wenn Entscheider schnell und bestens informiert entscheiden können.

Wer braucht Big Data? Und wie gehen wir damit um?

Wer braucht welche Fähigkeiten? Wer hat welche Rolle im System? Für den Data Engineer sind nur einzelne Aspekte von Big Data wichtig. Er muss sie allerdings beherrschen, um die Daten zur Analyse zur Verfügung stehen. Sein Interesse ist die Datenqualität. Für den Data Scientist ist Big Data der Kern seiner Arbeit. Er untersucht große Datenmengen mit Methoden aus der Mathematik, Statistik und Informatik auf eine bestimmte Fragestellung hin. Das Ziel: Mit der Analyse eine Handlungsempfehlung geben zu können. Auf der Entscheiderebene des CDO wird Big Data aus einem Kosten-Nutzen-Kalkül betrachtet.

Nicht zu vergessen: Datenschutz. Projekte können von der neuen DSGVO betroffen sein. Entscheidend ist, ob ausschließlich Maschinendaten oder auch personenbezogene Daten verarbeitet werden. Mit dem Datenschutz kommt auch die Frage nach der Datensicherheit auf. Die Data Governance ist hier verantwortlich für diese Aspekte.

Warum können Datenprojekte scheitern? Die Hauptfaktoren:

Data Skills: Datenkompetenz in Unternehmen fehlt

Data Governance: Verantwortung ist nicht definiert

Data Engineering: Der technische Aufwand, der mit Big Data verbunden ist, wird unterschätzt.

Data Science: Es bestehen unrealistische Vorstellung, was mit Big Data möglich ist.

Welche Methoden, Tools und Technologien gibt es?

Supervised Machine Learning, Machine Learning, Unsupersived Machine Learning und Deep Learning zählen zu den verbreitetsten und zurzeit wichtigsten Methoden zur Analyse von Big Data. Die verwendeten Methoden hängen von der jeweiligen Fragestellung und dem Ziel des Projektes ab. Ein wichtiger technischer Lösungsansatz bei Big-Data-Projekten ist der Data Lake. Hier werden Daten aus allen möglichen Quellen und Kontexten zusammengefasst. Cloud-Lösungen können auch einen wichtigen Teilaspekt bei Big-Data-Lösungen darstellen – insbesondere, wenn es um Geschwindigkeit bei der Verfügbarkeit von Daten geht. Gerade dieser Aspekt, machte es Big Data in den Anfangsjahren sehr schwer, da die benötigten Kapazitäten nicht vorhanden oder schier nicht zu bezahlen waren. Es scheiterte auch an den nicht vorhandenen Daten, die vor einigen Jahren von den Nutzern einfach nicht vorlagen. Die „German Angst“ lässt bei immer mehr Nutzern nach, so dass man bereitwilliger Auskunft über sich gibt.

Aktuell gibt es eine Vielzahl von Big Data Lösungen, die aufgrund unterschiedlicher Anforderungen und betriebsindividuellen Voraussetzungen entstanden sind. So gibt es nicht für jedes Projekt und jede Herausforderung die eine Lösung.

Big Data längst keine Catch Phrase mehr, sondern hat sich am Markt fest etabliert, als neuer Industrie-Standard.

Warum Big Data cool ist oder Wie nützt Advanced Analytics meinem Unternehmen?

Big Data ist in aller Munde. Oft im negativen Zusammenhang. Unsicherheit ist ein großes Thema. Einer der Gründe warum Datenschutz wichtig und wichtiges und richtig ist. Fragen wie: Was passiert mit meinen Daten? Wer weiß was über mich? Zum Beispiel über mein Kaufverhalten? Was kaufe ich wann, wo, in welchen Mengen? Dabei kann man es durchaus von der positiven Seite betrachten. Jeder Kunde erhält genau die Empfehlungen, die er braucht. Der Spam-Ordner im E-Mail-Postfach wird kleiner. Von der wirtschaftlichen Perspektive gesehen, sparen Unternehmen Zeit und Ressourcen in der Kundengewinnung und – bindung. Verbraucher sparen Zeit für langdauernde Produktrecherchen.

Welche Methoden werden im Bereich des Data-Science angewandt? Technologisch vorne sind sogenannte Advanced Analytics. Fortschrittlicher gegenüber den klassischen Methoden, wie zum Beispiel der Regression Analysis. Zu den Advanced Analytics gehören unter anderen Machine Learning oder Neuronale Netzwerke. Diese Methoden können große Datenmengen bei geringen Kosten auswerten.

Diese Methoden sind in der Lage Analysen zu Prognosen über zukünftige Ereignisse zu liefern. Sie werden darum auch Predictive Analytics genannt. Zum Beispiel: Ein Kunde kauft ein bestimmtes Produkt. Wenn er diese gekauft hat, folgt in der Logik, dass er Produkt xy auch kaufen wird. Das ist eine Schlussfolgerung aus der Auswertung verschiedenster Kundendaten.

Damit sind Unternehmen in der Lage proaktiv zu handeln. Sie können zum Beispiel voraussehen, was passiert, wenn ich nur einen Parameter in der Analyse ändere. Und welche Handlungsempfehlungen entstehen dann daraus? Das heißt sie sind komplett auf die Zukunft ausgerichtet. Der Blick in die Vergangenheit ist nicht mehr nötig. Durch Künstliche Intelligenz wird Wissen automatisch generiert und nicht mehr manuell.

Advanced Analytics findet überall statt

Die Bandbreite der Anwendungsbereiche lässt sich nicht einschränken. Sie findet Anwendung in jeder Industrie und jedem Wirtschaftsbereich.

Gerade im Hinblick auf die Churn Prediction, also der Verhinderung von Kundenabwanderungen, (Kundenbindung und Kundenloyalität sind zwei zentrale Ziele eines nachhaltigen Geschäftsprozesses). Und das hört auch nicht bei der richtigen Platzierung von Waren in einem Supermarkt auf. Die Datenmengen werden immer größer. Daten sollten nicht ungenutzt und unstrukturiert genutzt werden. Gerade um Prozesse im Unternehmen besser zu verstehen und zu steuern.

Viele Analysewerkzeuge sind Open-Source-Tools. Sie sind kostenlos nutzbar und gerade im Einführungsprozess optimal. Zu den geeigneten Tools gehören zum Beispiel Hadoop, Hive oder Spark an.

Weiterführend kann der Experte im Unternehmen anhand von konkreten Fragestellungen eine der gängigen Analysetechniken auswählen. Zu den Advanced Analytics Methoden zählen beispielsweise:

  • Deep Learning oder Machine Learning
  • Neuronale Netzwerke
  • Text Mining bzw. Data-Mining
  • Clusterverfahren
  • Entscheidungsbäume

Welche Entscheidung ist die Beste?

Mit Advanced-Analytics-Lösungen können bessere Entscheidungen getroffen werden. Im Zeitalter von Big-Data ist es notwendiger denn je geworden, aus den schnell wachsenden Datenmengen gewinnbringende Erkenntnisse herauszuholen. Die Kostenintensive Erhebung, sichere Speicherung und die richtige Verwaltung der Daten, machen es quasi unabdinglich diese zur Steigerung der Wirtschaftlichkeit eines Unternehmens zu nutzen.

Um den Kunden zielgerichtet ohne große Wartezeiten genau nach seinen Bedürfnissen ausgerichtet bedienen und beraten zu können. Wird die Anwendungen dieser Daten, auch für den Kunden selbst nur von Vorteil sein.

Technologische Singularität und ein Wimpernschlag

Sind wir nur noch einen Wimpernschlag davon entfernt als Wesen mit der höchsten Intelligenz einer KI abgelöst zu werden?
Oder handelt es sich zurzeit nur um Schlagwörter von progressiven Zukunftsprognosen?

Wie geht man als KMU mit den sich rasant wachsenden Technologien, die bereits fundamentale Implikationen auf unseren Alltag haben, um?
Ist man Zaungast, oder versucht man die Digitale Zukunft mitzugestalten?

All diese Fragen stellt man sich in einem Unternehmen, das den Wandel von Daten, die via Magnetband ausgelesen und dann bearbeitet an den Lettershops und/oder Druckereien versendet wurden bis hin zur Versendung dieser Daten über verschlüsselte Datenleitungen innerhalb von Minuten, vollzogen hat.

Wir haben den Automatisierungstrend erlebt, der eigentlich nicht neu war/ist. Bereits vor 20 Jahren haben wir Daten mit Hilfe von Skripten verarbeitet, die uns viele Schritte abgenommen haben.
Natürlich kann man den Grad an Automatisierung von damals nicht mit den heutigen Möglichkeiten vergleichen, aber der Grundgedanke war gleich.
Reicht das, um für den digitalen Wandel gerüstet zu sein? Lieber Mitläufer als Vorläufer? Genügt das unseren Kunden?

Protokolle, Auswertungen und die gesamten Kommunikationen haben sich, genau wie Prozesse, die unsere Mitarbeiter durchführen über Jahre etabliert.

Wie lassen sich diese Themen digital darstellen und zwar so, dass wir unseren Kunden, die bereits seit mehr als zwanzig Jahren mit uns arbeiten, gerecht werden?

Wofür man früher eine einfache Text Datei gebraucht hat um Werte darzustellen und diese zeitnah geliefert hat, benötigt man heute Diagramme in „real Time“.

Also, stehen wir vor der Frage, wie werden wir zukünftig Daten verarbeiten?
Wie visualisieren wir Prozesse besser?
Wie und in welchem Zeitraum stellen wir Daten unseren Kunden zur Verfügung stellen?

Wie können unseren Kunden diese Daten nutzen um ihren „Digital Value Chain“ zu optimieren?

Sich diese Fragen zu stellen erfordert auch Mut. Bei Führungskräften und auch deren Mitarbeitern.

Gibt es Innovatoren im Unternehmen, sind etablierte Mitarbeiter auch willens die Änderungen, die mit der Digitalisierung einhergehen anzunehmen?

Die Erkenntnis, dass Mitarbeiter und Strukturen sich langsamer verändern als die IT ist allgemein bekannt. Sind wir bereit bestehende Strukturen aufbrechen?
Aus Feedback wissen wir, dass unser Unterfangen nicht ganz unkritisch aufgenommen wird. Der Eindruck, die Arbeit, die man all die Jahre nach bestem Wissen abgeleistet hat, Systematiken die man entwickelt hat, wurden nun einfach ersetzt, herrscht teilweise vor.

Wir wollen nicht nur die Digitalisierung bisher analog ablaufender Geschäftsprozesse, sondern vielmehr neue datengetriebene Modelle aufstellen, in erster Linie nicht um neue Wertschöpfungsquellen zu erschließen, sondern vielmehr um den Dienstleistungsgedanken am Kunden besser ausbauen zu können.

Natürlich muss sich ein Invest an Personal, und Hardware „auszahlen“, das ist jede unternehmerische Absicht, aber ist es nicht auch wichtig eine passende Antwort zu haben, wenn einen der Vertriebler fragt, was unterscheidet euch eigentlich von x oder y?

Was sind also die Vorteile der Digitalisierung? Um Probleme schneller zu erkennen und Prozesse besser zu verstehen, benötigt es Disziplin und organisierte Abläufe. Diese erreicht man durch die Anreicherung von aktuellen Daten innerhalb von Software, denn genau das erfordern digitale Technologien.

Also, wie geht man das Thema Digitalisierung oder Industrie 4.0 in einem KMU an?

Teil 1