Daten entstehen. Überall. Weil grundsätzlich alles digitaler wird.
Daten bieten das Potentiale, durch gezielte Nutzung und Auswertung bestimmter Daten neue Aussagen und Entscheidungen treffen zu können. Die Frage ist nur: Kann ich die entstehenden Daten in der Art verwenden, wie sie entstehen und gesammelt werden? NEIN!
In fast allen Fällen müssen Daten durch Datenmanagement vorbereitet werden, um beispielsweise Qualität und Sicherheit von Daten zu verbessern oder den Umgang mit Daten bewusster zu machen. Erst wenn die Vorbereitungen ausreichend sind – betreffend die 6 Kategorien des Datenmanagements – können die Daten zu aussagekräftigen Ergebnissen verarbeitet werden.
Datenmanagement
Darstellung der einzelnen Kompenenten von Datenmanagement, das die Voraussetzungen für den Umgang und die Auswertung von Daten im Unternehmen beschreibt.
Datenmanagement beschäftigt sich mit dem “Leben” der Daten – von der Entstehung und Speicherung bis hin zum Archivieren und Löschen. Dabei soll das Datenmanagement zu jedem Zeitpunkt die Unternehmens-Ziele und -Prozesse optimal unterstützen: durch die Bereitstellung von optimal vorbereiteten Daten.
Betrachtet man das „Leben“ der Daten, von Entstehung bis zur Auswertung durch den Nutzer, zeigt sich, dass die Vorbereitung der Daten durch das Datenmanagement 80% der Zeit benötigt – während die eigentliche Auswertung nur 20% der Zeit benötigt 1. Dies zeigt deutlich die Wichtigkeit des Themas Datenmanagement.
Unter den Begriff Datenmanagement fallen die Punkte:
Datenmanagement soll einerseits helfen, die Nutzung von Daten zu regeln und zu steuern. Andererseits sollen dadurch vorhandene Daten so aufbereitet werden, dass eine Analyse der Daten, z.B. mittels Business Intelligence, möglich ist. Dabei spricht man von Big Data Management, wenn die Menge an Daten groß ist und dadurch die normalen Bearbeitungsmethoden nicht mehr genutzt werden können.
Wird Datenmanagement unternehmensweit implementiert, können einige Vorteile erreicht werden:
Die größten Herausforderungen beim Thema Datenmanagement betreffen hauptsächlich die Implementierung eines solchen Systems, denn
Gleichzeitig ist natürlich auch wichtig, dass schon in der Konzeptionierungs-Phase die notwendigen Experten eventuell auch von extern mitarbeiten, damit die Dimensionierung und Auslegung für das Unternehmen optimal gewählt werden. Experten inhouse oder extern sind auch notwendig, um die richtige Datenaufbereitung festzulegen. Diese ist notwendig, damit Daten gespeichert werden können, um anschließend vom Nutzer weiterverarbeitet werden zu können.
Für die Umsetzung von Datenmanagement im Unternehmen ist viel Konzeptionierung und Kommunikation notwendig. Es muss ein Pflichten- und Lastenheft geschrieben werden, in dem in Absprache mit dem/den Experten alle notwendigen Details beschrieben werden. Solche Details umfassen z.B. die eindeutige Benennung von Daten, die Wahl von Dateiformaten usw. Mit der richtigen Kommunikation schafft man das Bewusstsein für die Notwendigkeit.
Wichtig ist in jedem Fall, dass
Vor allem der barrierefreie Zugang zu den unterschiedlichen Daten ist wichtig, damit der bestmögliche Nutzen für das Unternehmen entsteht – durch Aufbrechen von Abteilungsgrenzen durch die Zentralisierung von Daten.
Es gibt unterschiedliche Arten von Daten, die eine unterschiedliche Zugriffs- und Rechte-Struktur benötigen. Der benötigte Schutz bzw. die benötigte Sicherheit ist abhängig davon, ob die Daten öffentlich zugänglich sind oder Unternehmens-Knowhow bzw. persönliche Daten beinhalten.
= alles, was sich direkt auf eine Person bezieht, z.B. Name, Einkommen, Rufnummern usw.
Umgang: Datenschutz = Teil von Datenmanagement
Zugriff: Nur wenige Mitarbeiter einer Firma
= alles, was sich direkt auf ein Unternehmen bezieht, z.B. Steuer-Daten, aber auch klassisches Knowhow in Form von z.B. Produktionsdaten, Prozesswissen, Best Practices, …
Umgang: Datensicherheit = Teil von Datenmanagement
Zugriff: nur wenige Mitarbeiter, bei Knowhow meist mehr, um Entwicklungen zu ermöglichen.
= alles, was nicht zum Zweck der Datenerhebung, sondern z.B. zur Kontrolle Zutrittsüberwachung installiert wurde
Umgang: Datensicherheit = Teil von Datenmanagement
Zugriff: mehrere Mitarbeiter zur Funktion der Überwachung, meist keine Mitarbeiter zur tatsächlichen Auswertung dieser Daten außer mit gesonderter Genehmigung
= alles, was bewusst aufgezeichnet wird, aber nicht unmittelbar mit dem Unternehmen verknüpft sind, wie z.B. die Aufzeichnung von Temperatur, Wetter usw.
Umgang: Datensicherheit = Teil von Datenmanagement
Zugriff: Alle Mitarbeiter, nicht von außerhalb des Unternehmens
= alles, das bewusst durch das Unternehmen veröffentlicht wurde bzw. für das Unternehmen öffentlich zur Verfügung steht
Umgang: rechtliche Aspekte wie z.B. Urheberrecht wahren
Zugriff: Alle Mitarbeiter und auch die Öffentlichkeit
Datenmanagement muss eine klare Verantwortlichkeits-Struktur haben. Wer ist dafür verantwortlich, dass Daten optimal vorbereitet vorliegen? Wer ist dafür verantwortlich, dass die Mitarbeiter die richtigen Zugriffsrechte haben? Verantwortlichkeiten müssen daher schon in der Phase der Implementierung von Datenmanagement geklärt werden.
Unter dem Begriff Daten-Verwaltung werden einige Punkte zusammengefasst, die hier kurz beschrieben werden:
Greift ein Nutzer auf Daten zu, muss zu jedem Zeitpunkt des Zugriffs gewährleistet sein, dass die Stammdaten in aktuellster Version vorliegen und nur einmalig vorkommen. Dafür ist ein Daten-Verwaltungsprogramm notwendig. Möglich sind z.B. Enterprise Ressource Planning ERP Systeme.
Die Vergabe von Zugriffsrechten für bestimmte Arten von Daten muss umfassend geregelt sein. In größeren Firmen oder Firmen mit höherer Personal-Fluktuation legt man sich am besten Referenz-Nutzer an, die für neue Mitarbeiter einfach übernommen werden kann.
Der Daten-Lebenszyklus beschreibt die Notwendigkeit, Daten von der Entstehung bis zur Löschung bzw. Archivierung zu überwachen. Das Datenmanagement muss sich mit dem gesamten Lebenszyklus beschäftigen und den Umgang mit Daten für die einzelnen Verarbeitungs-Möglichkeiten beschreiben. Dazu gehört auch die Definition, ab wann Daten gelöscht/archiviert werden.
Rechtliche Aspekte, wie z.B. Aufbewahrungsfristen, müssen durch die Daten-Verwaltung unternehmensübergreifend festgelegt und auch überwacht werden.
Das Thema Daten-Konsistenz betrifft alle Bereiche des Unternehmens, denn in allen Bereichen werden Daten gesammelt – und dies sollte möglichst konsistent sein.
Bei Daten-Governance werden allgemeingültige Richtlinien festgelegt, die die generelle Datenverwendung regulieren und unterstützen. Die Datenverwendung betrifft z.B. die Sammlung, den Transport oder die Verarbeitung von Daten. Für alle diese Vorgänge müssen Richtlinien vorliegen. Der Bereich Daten-Governance überwacht die Einhaltung dieser Richtlinien, auch bei den anderen Funktionen des Datenmanagements.
Wichtig ist, dass Richtlinien zu Verwendung von Daten unternehmensweit einheitlich vorliegen und vor der Umsetzung auch unternehmensweit kommuniziert werden.
Die Qualität der Daten ist ausschlaggebend für die Qualität der Auswertung. Mittels geeigneter Software-Programme kann die Daten-Qualität evaluiert werden. Bei der Evaluation der Qualität muss darauf geachtet werden, dass
Die Handhabung der großen Datenmenge ist eine Sache, die Speicherung und das zur Verfügung stellen von Daten nochmal eine andere.
Mittels Daten Warehouse können strukturierte Daten gespeichert werden physisch oder Cloud, um in nachfolgenden Analysen jederzeit darauf zugreifen zu können. Die Daten im Data Warehouse sind für jeden Nutzer zugänglich und auch für jeden Nutzer zu gebrauchen weil eine Bearbeitung der Daten zur Speicherung im Warehouse stattgefunden hat.
Ein Data Lake = Daten See unterscheidet sich von einem Data Warehouse durch die Art der Speicherung. Im Data Lake werden unbearbeitete Roh-Daten gespeichert, d.h. es können auch unstrukturierte vorliegen. Diese können z.B. im Data Warehouse nicht gespeichert werden. Die Daten im Data Lake sind meist NICHT für den klassischen Nutzer zu gebrauchen, sondern sind Datenquelle für Data Scientists, Data Analysts usw. Diese arbeiten für die Berechnung von Modellen, Algorithmen und Statistiken mit den Rohdaten und wenden lieber eigene Kriterien zur Filterung und Verarbeitung an.
Die Daten-Sicherheit ist vermutlich der wichtigste Aspekt innerhalb des Datenmanagements und betrifft alle Funktionen des Datenmanagements. Jedes Unternehmen sollte sich mit Daten-Sicherheit auseinandersetzen. Darunter fällt z.B.
Alle diese Risiken und noch viele weitere müssen durch gut durchdachte und rechtzeitig implementierte Daten-Sicherheitsmaßnahmen abgedeckt werden. Generell ist ein ganzheitliches Konzept für die Datensicherheit wichtig.
Der Daten-Schutz beschreibt die Einordnung bestimmte Daten in persönlich schützenswerte Daten. Sind diese Daten betroffen, gilt der Datenschutz – innerhalb der EU nach DSGVO.
Datenmanagement ist ein großes und wichtiges Feld mit vielen unterschiedlichen Funktionen. Die Vorbereitung von Daten benötigt 80% der Zeit 1 – dies unterstreicht die Wichtigkeit eines optimal funktionierenden Datenmanagements bzw. Datenstrategie.
Häufig hat die effektive Nutzung und Implementierung von Datenmanagement nicht nur mit dem fachlichen Knowhow als Data Scientist zu tun. Meistens hängt es mit der Denkweise von Mitarbeitern, Führungskräften und Geschäftsführung zusammen, dass Datenmanagement nicht so effektiv ist wie gewünscht! Wichtig sind daher alle Punkte, die auch für die generelle Implementierung von Digitalisierung gelten:
Datenmanagement ist wichtig und darf auch nach erstmaliger Implementierung nicht vernachlässigt werden. Es muss lebendig sein und sich an neue oder an sich wandelnde Bedingungen leicht anpassen – während gleichzeitig zu jeder Zeit der notwendige Schutz der Daten gewährleistet ist! Es ist daher ist ein agiles und dynamisches Datenmanagement notwendig, das im Unternehmen als solches wertgeschätzt werden sollte.
1 Forbes Untersuchung zum Thema Datenvorbereitung 08.04.2021
Was ist Data Management 06.04.2021
Was ist Datenmanagement 06.04.2021
Was ist Data Governance 06.04.2021
Was ist Datenmanagement 06.04.2021