Analytics, Daten & KI

Was ist Datenmodellierung (Inmon, Kimball, Data Vault)?

Datenmodellierung ist der strukturierte Entwurf, wie Daten in einem Data Warehouse oder Lakehouse organisiert, in Beziehung gesetzt und gespeichert werden. Die drei verbreitetsten Ansätze sind Inmon (normalisierter Unternehmenskern), Kimball (dimensionale Sternschemata für Reporting) und Data Vault (flexibler, historisierter Integrationsansatz).

Auch bekannt als: Data Modeling · Datenmodell · dimensionale Modellierung · Sternschema · Faktentabelle · Dimensionstabelle · Fact Table

DatenmodellSternschema
ZeitKunde
FaktentabelleKennzahlen
ProduktRegion
Eine zentrale Faktentabelle verbindet sich direkt mit mehreren Dimensionen.
01

Einordnung: Wofür wird Datenmodellierung genutzt?

Datenmodellierung legt fest, in welchen Tabellen und Beziehungen Daten abgelegt werden, damit sie verständlich, konsistent und performant abfragbar sind. Ein gutes Modell entscheidet maßgeblich darüber, wie schnell und verlässlich später Berichte und Analysen entstehen.

Die drei Ansätze setzen unterschiedliche Schwerpunkte. Inmon (Top-down) baut zuerst einen stark normalisierten, unternehmensweiten Kern und leitet daraus fachliche Data Marts ab; das fördert Konsistenz, ist aber aufwändiger im Aufbau. Kimball (Bottom-up) modelliert dimensional in Stern- oder Schneeflockenschemata mit Faktentabellen und Dimensionen; das ist direkt reporting- und Power-BI-freundlich. Data Vault trennt Hubs (Geschäftsschlüssel), Links (Beziehungen) und Satellites (beschreibende, historisierte Attribute); das ist besonders flexibel, gut historisierbar und robust gegenüber Quelländerungen.

02

Beispiel aus der Praxis

In der Datenplattform der dy Project AG, einem Großbauprojekt mit über 1 Mrd. CHF Volumen, wurden Daten aus SQL Server, Excel und REST-APIs auf Azure Databricks integriert. Ein Data-Vault-naher Ansatz hilft, viele wechselnde Quellen flexibel und historisiert zu integrieren, während die für Power BI bereitgestellte Gold-Schicht dimensional im Kimball-Stil modelliert wird, damit Berichte performant und verständlich bleiben.

03

Faktentabellen & Dimensionen

Im dimensionalen Modell (Kimball) sind zwei Tabellentypen zentral:

  • Faktentabelle (Fact Table): enthält die messbaren Kennzahlen eines Geschäftsvorgangs – etwa Umsatz, Menge oder Kosten – samt Verweisen auf die zugehörigen Dimensionen.
  • Dimensionstabelle (Dimension): liefert den beschreibenden Kontext, nach dem ausgewertet wird – z. B. Zeit, Kunde, Produkt oder Region. Dimensionen beantworten das „nach was?“ einer Auswertung.
  • Sternschema: die Anordnung, bei der eine zentrale Faktentabelle direkt mit mehreren Dimensionstabellen verbunden ist – einfach, performant und für Power BI ideal.
04

Abgrenzung & Bezug zu smiit

Die drei Ansätze schließen sich nicht aus, sondern werden oft kombiniert: Data Vault für die flexible, historisierte Integration vieler Quellen, ein dimensionales Kimball-Modell für die reporting-nahe Auslieferungsschicht, Inmon als Leitidee eines konsistenten Unternehmenskerns. Sie sind eine Ebene unterhalb der Architekturidee, etwa der Medallion-Architektur, die festlegt, in welchen Stufen Daten veredelt werden. smiit wählt den Ansatz nach Quellenlage, Änderungsdynamik und Reporting-Anforderungen und kombiniert sie pragmatisch, statt dogmatisch einem Lager zu folgen.

Häufige Fehler & Missverständnisse

  • Datenmodellierung ist nicht nur das Anlegen von Tabellen; sie definiert Entitäten, Beziehungen und Granularität und entscheidet maßgeblich über Performance und Auswertbarkeit.
  • Viele glauben, ein einziges flaches Tabellenmodell sei am einfachsten. In der Analytik ist meist ein Sternschema mit Fakten und Dimensionen klarer und performanter.
  • Ein verbreiteter Irrtum ist, dass Normalisierung immer das Ziel ist. Für Berichte und BI ist eine bewusste Denormalisierung oft sinnvoller als ein strikt normalisiertes Modell.

Häufige Fragen

Welcher Modellierungsansatz ist der beste?

Es gibt kein generelles Bestes. Kimball ist reporting-freundlich, Data Vault stark bei vielen, sich ändernden Quellen und Historisierung, Inmon liefert einen konsistenten Unternehmenskern. In der Praxis werden sie oft kombiniert.

Was ist der Unterschied zwischen Kimball und Data Vault?

Kimball modelliert dimensional in Sternschemata für direktes Reporting. Data Vault trennt Hubs, Links und Satellites für flexible, historisierte Integration und wird häufig als Schicht vor einem dimensionalen Modell genutzt.

Was sind Faktentabelle und Dimension einfach erklärt?

Eine Faktentabelle enthält die messbaren Werte eines Geschäftsvorgangs, etwa Umsatz oder Menge. Eine Dimension liefert den beschreibenden Kontext, nach dem ausgewertet wird, etwa Zeit, Kunde oder Produkt. Im Sternschema verbindet eine zentrale Faktentabelle direkt mehrere Dimensionen.

Wie hängen Datenmodellierung und Medallion-Architektur zusammen?

Die Medallion-Architektur legt fest, in welchen Stufen (Bronze, Silver, Gold) Daten veredelt werden, die Datenmodellierung legt fest, wie die Tabellen innerhalb dieser Stufen strukturiert sind. In der Praxis wird die für Reporting bestimmte Gold-Schicht oft dimensional modelliert.

Verwandte Begriffe

Quellen & weiterführende Links

Sie möchten dieses Thema in Ihrem Unternehmen umsetzen?

Aktualisiert am · Zurück zum Glossar

Kontaktieren Sie uns