Big Data – Mehr als nur Daten

Die umfangreiche Erfassung und Aufbereitung von Daten ist in diesen Zeiten ein wesentlicher Faktor für die Optimierung von Arbeitsprozessen und somit den Erfolg sowie das nachhaltige Wachstum Ihres Unternehmens. Bekannteste Beispiele im Bereich der „Big Data“ sind beispielsweise die Internetgiganten Google und Facebook.

Doch wann sollten Sie sich Gedanken darüber machen, die Erfassung und Aufbereitung Ihrer Daten in professionelle Hände zu geben? Hier eine kleine Checkliste:

  • Sie haben es mit größeren Datenmengen zu tun, die nicht mehr mit einer einfachen Tabellenkalkulation oder kleineren Datenbankanwendungen zu beherrschen ist
  • Ihre Daten stehen in komplexen Beziehungen zueinander
  • Es kommt eine große Menge verschiedener Datentypen zusammen (beispielsweise String, Date, Float, Integer, Money, Text und Binary)

Sollten sie eine oder mehrere Fragen mit „Ja“ beantwortet haben, fällt oft der Begriff ETL.

ETL - Extrahierung, Transformierung und Ladung von Daten

Der Begriff ETL fällt oft im Zusammenhang mit Datawarehouse. Es handelt sich um die Zusammenfassung und Bereitstellung von Daten aus verschiedenen Quellen an einem Ort (Repository) zur weiteren Analyse und Auswertung. Damit dieses so effizient wie möglich geschehen kann, ist der Einsatz von Metadaten unerlässlich.

Metadaten - Der Superkleber der Datenmodelle

Eine Sammlung verschiedenster Daten, Datentypen und Datenzusammenhänge ist nur so gut, wie das dazu gehörige Metadaten Modell.

Metadaten sind „Daten über Informationsobjekte“, d.h. über Daten, Prozesse, Services, Ontologie und Informationsmodelle. Erst die Metadaten und deren konsequente Verwaltung machen es möglich, durch klare, präzise und eindeutige Beschreibungen inkl. Maßeinheiten, die betrachteten Daten und deren Beziehungen zu beschreiben.

Die Struktur und der Rahmen für den Aufbau von Metadaten Repositories (MDR) sind dabei klar definiert in der ISO 11179/19763.

MDR – Sinnvoll auch bei weniger umfangreicher Datenlage

Der Aufwand für ein kleines MDR lohnt sich in jedem Fall schon aus folgenden Gründen:

  1. Daten vermehren sich naturgemäß in unserer immer komplexer werdenden digitalen Welt
  2. Datenzusammenhänge und -Abhängigkeiten werden mit zunehmendem Datenbestand sichtbarer und besser beschreibbar
  3. Der Datenaustausch wird durch den Einsatz eines MDR leichter automatisierbar, kompatibler mit anderen MDR und einfacher zu dokumentieren

Fragen Sie uns!

Sie haben weitere Fragen zu ETL, Metadaten, MDR oder Datenmodellen im Allgemeinen? Kontaktieren Sie uns per Email oder nutzen Sie unseren Chat.

Email

Contact