? Data Governance - Datenqualität : SEEOcta Projektmanagement Daten
SEEOcta

SEEOcta-Daten: Data Governance – Datenqualität

| | Director Business Unit E-Invoicing/SAP&Web Prozesse, SEEBURGER AG
SEEOcta-Daten

Die Bereitstellung und Nutzung von Daten ist heutzutage für viele Unternehmen überlebenswichtig. Umso erstaunlicher wirkt es, dass eine organisatorische Regelung hierfür in vielen Unternehmen noch immer nicht zum Standard zählt. Data Governance stellt ein geeignetes Rahmenwerk dar, welches die Grundlage für den Umgang mit und die Bewirtschaftung von Daten in einer Organisation für alle Beteiligten bildet. Je größer und breiter der Datenbestand des Unternehmens ist, desto bedeutsamer wird die sichere, performante und nachvollziehbare zentrale Bereitstellung der Informationen. Eine hohe Datenqualität ist die Voraussetzung für deren effiziente Nutzung und die Grundlage für neue, datenbasierte Geschäftsmodelle.

Im Rahmen unserer SEEOcta-Reihe befasst sich dieser Beitrag mit dem Thema Data Governance und in weiteren Blogs der Perspektive „Daten“ geht es um den medienbruchfreien Datenaustausch, Big Data sowie OCR-Erkennung.

Die SEEOcta-Blog-Serie beleuchtet alle Bereiche, die bei der Planung von Digitalisierungs- und Integrationsvorhaben in Unternehmen zum Tragen kommen. Diese Impulse bilden eine Grundlage und einen Leitfaden für Ihre Projektplanung und helfen Ihnen sicherzustellen, dass Sie alle Aspekte bei der Einführung eines IT-Projektes berücksichtigen.

Data Governance – Die Datenflut im Griff

Wir leben im Digitalisierungszeitalter. Daten werden vermehrt zu einer Ware, die die Basis für eine Vielzahl von neuen Geschäftsmodellen bildet. Welche Bedeutung Daten in unserem Alltag mittlerweile haben, veranschaulichen die folgenden Beispiele auf beeindruckende Weise: Laut Statista wird die weltweit erzeugte Datenmenge bis 2025 auf ca. 175 Zettabytes anwachsen (das ist eine 175 mit 21 Nullen)[1]. Im Vergleich zu 2016 wird sich die Datenmenge bis dahin verzehnfacht haben und unvorstellbaren 175 Milliarden 1TB-Festplatten entsprechen. Würde man diese 175 ZB auf DVD speichern, überträfe der Stapel mit Datenträgern 23 Mal die Entfernung zwischen Erde und Mond[2]. Im Jahr 2020 betrug die Menge an Daten, die weltweit erstellt, vervielfältigt und konsumiert wurden, circa 40 Zettabytes. Dies ist 50-mal so hoch wie noch vor drei Jahren. 40 Zetta – das entspricht nach Schätzungen der Forscher 57-mal der Menge an Sandkörnern aller Strände der Erde. Und man rechnet damit, dass sich das Volumen des Datenbestands zukünftig alle zwei Jahre verdoppeln wird.[3]

Doch wo kommen all die Daten her, und wie kann man sie überhaupt noch bewältigen? Durch die stetig zunehmende weltweite Vernetzung von Menschen, Maschinen und Unternehmen werden heutzutage in den Unternehmen eine Vielzahl von Daten über Kunden, Lieferanten, Produkte, Prozesse, Geräte und Mitarbeiter für die unterschiedlichsten Zwecke generiert und gespeichert. Die Krux dabei ist, dass die wenigsten Unternehmen ein fundiertes Datenqualitätsmanagement (eng. Data Governance) betreiben. Das heißt, das Potenzial, dass in all diesen Daten steckt, wird häufig nur zu einem ganz geringen Teil sinnvoll genutzt. Und damit nicht genug: Ein großer Teil dieser Daten ist von mangelhafter Qualität. Dies hat im besten Falle unnötigen Mehraufwand durch ständige Fehlerkorrekturen im Unternehmen, im ungünstigen Fall jedoch unzufriedene Kunden, teure Fehlbestände im Lager sowie gescheiterte IT-Projekte zur Folge:

  • Fehler in den Daten verursachen Fehler in daraus generierten Berichten;
  • mangelndes Vertrauen in Daten führt zu Fehlentscheidungen;
  • Chancen werden verpasst, wenn Daten verspätet oder unverständlich sind.

Nach einer IBM Schätzung aus dem Jahre 2016 belaufen sich die Kosten infolge schlechter Datenqualität alleine in den USA auf jährlich 3,1 Milliarden US-Dollar.[4]

Was ist Data Governance?

Mit intelligenter Data Governance kann dem entgegengewirkt werden. In der Studie „How to rule your data world” des Business Application Research Center (BARC) vom November 2018[5], wird Data Governance wie folgt definiert:

  • „Data Governance umfasst die Menschen, Prozesse und Technologien, die zur Verwaltung und zum Schutz des Datenkapitals eines Unternehmens benötigt werden, um allgemein verständliche, korrekte, vollständige, vertrauenswürdige, sichere und auffindbare Unternehmensdaten garantieren zu können.“[6]

Data Governance Handlungsfelder

Abbildung 1: Data Governance Handlungsfelder (Quelle: Mit Data Governance Risiken minimieren – b.telligent)

Dies schließt sämtliche Handlungsfelder im Unternehmen ein. Erst die grundsätzliche Nachverfolgung von Daten, von der Quelle bis zur Auswertung (egal welcher Art), die technische und fachliche Dokumentation der Daten sowie die angewandten Transformationen erlauben einem Unternehmen, endgültige Aussagen zu Richtigkeit und Aussagekraft der Informationen zu treffen.

  • Data Governance schafft den organisatorischen Rahmen für den Umgang mit Daten, strukturiert Rollen und Verantwortlichkeiten und unterstützt dadurch die Datennutzung im Unternehmen – zugleich setzt sie Spielregeln im Umgang mit Daten auf.[7]

Nach dem Nutzen durch die Implementierung von Data Governance-Maßnahmen befragt, berichtet die Mehrheit der in der BARC-Studie befragten Unternehmen (53 Prozent), dass sich Entscheidungsprozesse verbessert hätten und ein einheitliches Verständnis der Daten erreicht worden sei, nachdem sie eine Data Governance etabliert hätten. Governance-Maßnahmen würden darüber hinaus helfen, optimale Bedingungen für datengetriebenes Arbeiten zu schaffen und den Weg zum digitalen Unternehmen zu ebnen (47 Prozent).

Top 6 Antworten auf: “Welchen Nutzen haben Sie durch die Implementierung von Data Governance Maßnahmen erreicht?“ (n=83)

Abbildung 2: Top 6 Antworten auf: “Welchen Nutzen haben Sie durch die Implementierung von Data Governance Maßnahmen erreicht?“ (n=83) (Quelle: How To Rule your Data World, BARC, November 2018, Seite 7)

Data Governance – Nur saubere Daten sind gute Daten

Das Ziel von Data Governance ist es, die Datenqualität zu erhöhen und auf hohem Niveau aufrechtzuerhalten und zu verbessern. Um dies zu erreichen, ist es erforderlich, die Daten gemäß der Kriterien Richtigkeit, Vollständigkeit und Aktualität zu bewerten; je nach Informationsbedarf kommen Aspekte der Weiterverarbeitung und des Zugangs hinzu.

Der kritische Punkt, an dem der Grad der Datenqualität festgelegt wird, ist der sogenannte „Point of Data Entry“, der Entstehungsort der Daten im Unternehmen. Je besser die mit der Datenübernahme beauftragten Mitarbeiter den Gesamtkontext kennen, in dem die Daten genutzt werden sollen, desto genauer werden diese auf die Datenqualität und die Vollständigkeit der übernommenen Daten achten:

  • Eine hohe CRM-Datenqualität, also die saubere und vollständige Erfassung der Kundenkontaktinformationen (Anrede, Email-Adresse, Funktion, etc.), sorgt beispielsweise dafür, dass Marketingaktionen reibungslos ablaufen und Kunden-Firmennamen für Vertriebsmaßnahmen eindeutig zugeordnet werden können.

Nun werden Daten nicht nur manuell von Mitarbeitern übernommen. Sie werden auch elektronisch von externen Quellen übermittelt und müssen unternehmensintern korrekten Zielorten und Verwendungszwecken zugewiesen werden, damit sie sinnvoll weiterverarbeitet werden können. Fehlerquellen müssen also von vornherein erkannt und ausgeschlossen werden. In der Praxis kann die Datenqualität als eine Menge von Qualitätsmerkmalen definiert werden. Die Auswahl und Klassifikation der relevanten Merkmale sind im nachstehenden Schaubild zusammengefasst[8]:

Data Governance - Auswahl und Klassifikation relevanter Merkmale

Abbildung 3: Data Governance – Auswahl und Klassifikation relevanter Merkmale (Quelle: Detail – Gesellschaft für Informatik e.V. (gi.de))

Die folgenden drei Faktoren sind maßgeblich für eine verminderte Datenqualität verantwortlich:

  • unvollständige Daten
  • uneinheitliche Daten
  • inkorrekte Daten

Diese Faktoren kommen durch ganz unterschiedliche Kriterien zustande. Betrachtet man eine Datenbank, so bietet diese vielfältige Möglichkeiten, Daten unvollständig, uneinheitlich oder gar inkorrekt einzugeben:

Data Governance - Fehlerhafte Daten in einer Datenbank

Abbildung 4: Data Governance – Fehlerhafte Daten in einer Datenbank[9]
  • Repräsentation
  • Widersprüche
  • Referenzintegrität
  • Keine Eindeutigkeit
  • Schreibfehler
  • Falsche Werte
  • Fehlende Werte (Leere Datenfelder)
  • Duplikate

Data Governance automatisieren – Datenqualität sicherstellen und erhalten

Techniken, wie sie gute Business-to-Business Kommunikationsplattformen bieten, stellen durch automatisierte Compliance-Checks die Qualität der Daten direkt beim Empfang sicher. Anschließend ist es wichtig, dass der Werdegang der Daten intern, von der Entstehung, Veränderung, Aggregation, bis hin zum Konsum der Daten für die Entscheidungsfindung, kontrolliert wird. Auch hier bieten heutige Datenbanksysteme bzw. Business-to-Business Kommunikationsplattformen mit ihren automatisierten Compliance-Checks (Filter) die Möglichkeit, Integritätsbedingungen zu formulieren. Z. B. erzwingen Compliance-Checks die Einhaltung bestimmter Formate (DD,MM,JJJJ), Werte (z.B. PLZ Wertebereich 00000 bis 99999) oder deren Konsistenz (PLZ, Telefon-Vorwahl, Ort).

Mittels der eingesetzten Prüfregeln lässt sich die Datenqualität deutlich erhöhen. Erkennungsmuster bezüglich der Erfüllung von Geschäftsvorgängen und Filter zur Prüfung der Daten auf Vollständigkeit im automatisierten Datenverkehr mit Geschäftspartnern tragen hierzu maßgeblich bei.

Data Governance – die Datenqualität mithilfe von Filterfunktionen gewährleisten
Abbildung 5: Data Governance – die Datenqualität mithilfe von Filterfunktionen gewährleisten

Mittels Filter kann bereits beim Import der Daten von außen gemäß der gewünschten Datenqualität gefiltert werden. Die so sauberen eingehenden Informationen werden entlang der Geschäftsprozesse angereichert. Sollten Daten an die Handelspartner versendet werden, können hierfür auch Datenfilter eingesetzten werden, bevor sie das Unternehmen verlassen. Durch den Einsatz intelligenter Software können selbst Dubletten durch eine Fusion oder Kombination der Datensätze eliminiert werden. Die Kombination der einzelnen Datensätze führt zu einem vollständigeren und verlässlicheren Datensatz.

Fazit

Dem Thema Data Governance kann sich kein Unternehmen verschließen. Data Governance sollte aber nicht als Einzelmaßnahme oder (IT)-Projekt verstanden werden. Data Governance ist vielmehr eine echte Chance, den Wertbeitrag der Unternehmensdaten zu erhöhen. Indem man sich Transparenz über die Datenhaltung und die Daten verschafft, kann diese dazu genutzt werden, Geschäftsmodelle weiterzuentwickeln. Für Unternehmen ist eine hohe Datenqualität zentral, da ohne die intelligente Nutzung und Bereitstellung digitaler Daten den heutigen Kunden- und Marktanforderungen nicht mehr entsprochen werden kann.

Die SEEBURGER Business Integration Suite ist die umfassendste Plattform für den digitalen Wandel und kann sie maßgeblich bei Ihren Data Governance-Maßnahmen unterstützen.

Dieser Beitrag ist Teil der SEEOcta-Reihe. In der Blog-Kategorie „SEEOcta“ finden Sie alle gesammelten Beiträge dieser Serie rund um die Einführung eines neuen IT-Projektes.

[1] https://de.statista.com/statistik/daten/studie/267974/umfrage/prognose-zum-weltweit-generierten-datenvolumen/

[2] https://blog.wiwo.de/look-at-it/2018/11/27/weltweite-datenmengen-sollen-bis-2025-auf-175-zetabyte-wachsen-8-mal-so-viel-wie-2017/

[3] https://www.welt.de/wirtschaft/webwelt/article118099520/Datenvolumen-verdoppelt-sich-alle-zwei-Jahre.html

[4] https://hbr.org/2016/09/bad-data-costs-the-u-s-3-trillion-per-year

[5] Download Now – Erreichung einer bisher ungeahnten Performance mit vernetzter Fertigung und Echtzeitfähigkeiten (sas.com)

[6] How To Rule Your Data World – Copyright CXP Group 2018, Page 3

[7] Mit Data Governance Risiken minimieren – b.telligent

[8] https://gi.de/informatiklexikon/datenqualitaet

[9] Abbildung 4 in Anlehnung an Whitepaper „Fünf Schritte zu hochwertigeren Unternehmensdaten“, Eberle GmbH, 2013, S. 3

Haben Sie Fragen oder Anmerkungen?

Wir freuen uns hier über Ihre Nachricht.

Teilen Sie diesen Beitrag, wählen Sie Ihre Plattform!
Rolf Holicki

Ein Beitrag von:

Rolf Holicki, Director Business Unit E-Invoicing, SAP&Web Prozesse, ist verantwortlich für die SAP-/WEB-Applikationen. Er hat mehr als 25 Jahre Erfahrungen in den Bereichen E-Invoicing, SAP, Workflow und Geschäftsprozessautomatisierung. Rolf Holicki ist seit 2005 bei SEEBURGER.