Was ist ein Data Mart?
A Datamart ist ein Warehouse, das Daten aus Betriebsdaten und anderen Datenquellen sammelt und einer bestimmten Gruppe von Fachleuten dient. Die Daten werden aus einer unternehmensweiten Datenbank oder einer spezialisierteren Datenbank extrahiert. Data WarehouseDer Sinn eines Rechenzentrums liegt darin, die spezifischen Anforderungen professioneller Benutzergruppen hinsichtlich Analyse, Inhalt, Leistung und Benutzerfreundlichkeit zu erfüllen. Nutzer von Rechenzentren erwarten eine ihnen vertraute Darstellung der Daten.
Data Mart vs. Data Warehouse:
Ein Data Warehouse ist eine integrierte, themenorientierte Datensammlung zur Unterstützung von Entscheidungsunterstützungssystemen (DSS). Jede Dateneinheit ist in einem Data Warehouse einer bestimmten Zeit zugeordnet. Ein Data Warehouse, bestehend aus Daten auf atomarer Ebene und leicht aggregierten Daten, ist eine themenorientierte, integrierte, nicht aktualisierbare (stabile), zeitvariable Datensammlung zur Unterstützung des Entscheidungsprozesses im Unternehmensmanagement.

Data Mart vs. Data Warehouse
Der Data Mart ist eine Teilmenge des Data Warehouse auf Unternehmensebene, das hauptsächlich auf Abteilungsebene und nur auf ein bestimmtes Thema ausgerichtet ist. Um den Widerspruch zwischen Flexibilität und Leistung zu lösen, ist ein Data Mart ein Data Warehouse auf Abteilungs- oder Arbeitsgruppenebene, das der Data-Warehouse-Architektur hinzugefügt wird. Data Marts speichern vorkalkulierte Daten für bestimmte Benutzer, um deren Leistungsanforderungen zu erfüllen. Sie können den Engpass beim Zugriff auf Data Warehouses bis zu einem gewissen Grad lindern.
Data Mart-Eigenschaften:
- klein in der Größe;
- haben spezifische Anwendungen;
- abteilungsorientiert;
- von Geschäftseinheiten definiert, entworfen und entwickelt;
- von Geschäftseinheiten verwaltet und gewartet;
- kann schnell umgesetzt werden;
- günstiger in der Anschaffung;
- schnelle Erholung der Investitionen;
- enge Integration von Toolsets;
- bietet eine detailliertere, bereits vorhandene, zusammenfassende Teilmenge des Data Warehouse;
- aufrüstbar auf ein vollständiges Data Warehouse;
Die Datenstruktur eines Data Mart:
Die Datenstruktur eines Data Marts wird oft als Stern- oder Schneeflockenstruktur beschrieben. Eine Sternstruktur besteht aus zwei grundlegenden Teilen: einer Faktentabelle und verschiedenen unterstützenden Dimensionstabellen.
1.Fact Tabelle
Die Faktentabelle beschreibt die dichtesten Daten im Data Mart. Bei einer Telefongesellschaft sind die für Anrufe verwendeten Daten typischerweise am dichtesten. Bei Banken sind Daten im Zusammenhang mit Abstimmungen und Geldautomaten typischerweise am umfangreichsten. Im Einzelhandel sind Verkaufs- und Bestandsdaten am dichtesten usw.
Eine Faktentabelle ist eine Kombination aus mehreren Arten von Daten, die bereits miteinander verknüpft sind. Dazu gehören: ein Primärschlüssel der Entität, der den Zweck der Faktentabelle widerspiegelt, z. B. eine Bestellung, ein Verkauf, ein Telefonanruf usw., Primärschlüsselinformationen, Fremdschlüssel, die die Faktentabelle mit der Dimensionstabelle verbinden, und externe Nicht-Schlüsseldaten, die von den Fremdschlüsseln übertragen werden.
Wenn diese nicht-Schlüsseldaten häufig für Datenanalyse in der Faktentabelle ist es im Umfang der Faktentabelle enthalten. Faktentabellen sind hochindiziert. Es ist üblich, 30 bis 40 Indizes für eine Faktentabelle zu haben. Manchmal ist jede Spalte der Faktentabelle indiziert, wodurch die Daten in der Faktentabelle sehr leicht lesbar sind. Die Anzahl der Ressourcen Der zum Importieren des Index erforderliche Wert muss in die Gleichung einbezogen werden. Normalerweise können Faktentabellendaten nicht geändert werden, aber Daten können eingegeben werden. Sobald ein Datensatz korrekt eingegeben wurde, kann für diesen Datensatz nichts mehr geändert werden.
2. Dimensionstabelle
Dimensionstabellen basieren auf Faktentabellen. Die Dimensionstabelle enthält nicht-intensive Daten, die über einen Fremdschlüssel mit der Faktentabelle verknüpft sind. Typische Dimensionstabellen basieren auf Data Marts, beispielsweise Produktkatalogen, Kundenlisten, Lieferantenlisten usw.
Die Daten im Data Mart stammen aus dem Enterprise Data Warehouse. Alle Daten, mit einer Ausnahme, sollten ein Enterprise Data Warehouse durchlaufen, bevor sie in einen Data Mart importiert werden. Eine Ausnahme bilden die spezifischen Daten des Data Mart, die nicht an anderer Stelle im Data Warehouse verwendet werden können. Externe Daten fallen in der Regel in diese Kategorie. Ist dies nicht der Fall und werden die Daten an anderer Stelle im Entscheidungsunterstützungssystem verwendet, müssen sie das Enterprise Data Warehouse durchlaufen.
Data Marts enthalten normalerweise zwei Arten von Daten: detaillierte Daten Und aggregierte Daten.
1. Detaillierte Daten
Wie bereits beschrieben, sind die detaillierten Daten im Data Mart in einer Sternstruktur enthalten. Erwähnenswert ist, dass das Sternschema beim Durchlaufen des Enterprise Data Warehouse gut aggregiert ist. In diesem Fall enthält das Enterprise Data Warehouse die notwendigen Basisdaten, während der Data Mart die Daten mit höherer Intervallgröße enthält. Für Data-Mart-Nutzer sind die sternstrukturierten Daten jedoch genauso detailliert wie zum Zeitpunkt ihrer Erfassung.
2. Aggregierte Daten
Der zweite Datentyp, den ein Data Mart enthält, sind aggregierte Daten. Analysten erstellen typischerweise verschiedene aggregierte Daten aus Daten in einem Sternschema. Ein typischer Rollup könnte beispielsweise der monatliche Gesamtumsatz der Vertriebsgebiete sein. Da sich die Aggregationsbasis ständig weiterentwickelt, befinden sich historische Daten im Data Mart. Der Vorteil dieser historischen Daten liegt jedoch im Grad der Generalisierung, den sie speichern. Im Sternschema werden nur sehr wenige historische Daten gespeichert.
Data Marts werden basierend auf Enterprise Data Warehouses aktualisiert. Es ist nicht ungewöhnlich, dass sie etwa einmal pro Woche aktualisiert werden. Die Aktualisierungszeit des Data Marts kann jedoch weniger als eine Woche oder mehr als eine Woche betragen, was hauptsächlich von den Anforderungen der Abteilung abhängt, zu der der Data Mart gehört.
Data-Mart-Typen:
1. Unabhängig
Die Daten des unabhängigen Data Marts stammen aus der operativen Datenbank, einer analytischen Umgebung, die speziell auf die Bedürfnisse spezieller Benutzer zugeschnitten ist. Der Entwicklungszyklus eines solchen Data Marts ist in der Regel kurz und flexibel. Da er jedoch vom Data Warehouse getrennt ist, kann es bei einem unabhängigen Data Mart zu Informationsinseln kommen, sodass die Daten nicht aus einer globalen Perspektive analysiert werden können.
2. Untergebener
Die Daten des untergeordneten Data Mart stammen aus dem Data Warehouse des Unternehmens, was den Entwicklungszyklus verlängern wird, aber der untergeordnete Data Mart ist in der Architektur stabiler als der unabhängige Data Mart, was die Qualität der Daten Analyse und Sicherstellung der Datenkonsistenz.
Vorteile von Data Mart:
- Es ist eine der kostengünstigsten Alternativen für Data Warehouses, in denen Sie nur eine kleine Teilmenge der Daten verarbeiten müssen.
- Durch die Trennung von Daten und Quellen werden Data Marts effizienter, da eine bestimmte Gruppe von Personen an Daten aus einer bestimmten Quelle arbeiten kann, anstatt dass jeder das Data Warehouse verwendet.
- Wenn wir wissen, auf welche Teilmenge wir zugreifen müssen, können wir mithilfe von Data Marts schneller auf die Daten zugreifen.
- Einfacher zu verwenden, sodass Endbenutzer problemlos Abfragen durchführen können.
- Da die Daten in Gruppen aufgeteilt sind, dauert die Eingabe in den Data Mart zur Implementierungszeit weniger Zeit als in ein Data Warehouse.
- Historische Daten zu bestimmten Themen können für eine einfache Trendanalyse verwendet werden.
Schritte zur Implementierung eines Data Mart:
Schritt 1. Entwerfen:
Dies ist der erste Implementierungsschritt, in dem alle Aufgaben und Quellen identifiziert werden, die zur Erfassung technischer und geschäftlicher Informationen erforderlich sind. Später wird ein logischer Plan implementiert, der nach Überprüfung in einen physischen Plan umgewandelt wird. Außerdem wird hier die logische und physische Struktur der Daten festgelegt, z. B. die Partitionierung der Daten und der Felder (z. B. Datums- oder andere Dateiformate).
Schritt 2. Konstruktion:
Dies ist die zweite Phase der Implementierung. Die Generierung der physischen Datenbank mithilfe des RDBMS wird im Rahmen des Entwurfsprozesses und der logischen Struktur festgelegt. Erstellen Sie alle Objekte wie Schemata, Indizes, Tabellen, Ansichten usw.
Schritt 3. Auffüllen:
Dies ist die dritte Phase, in der Sie die Daten beim Abrufen auffüllen. Alle erforderlichen Transformationen werden vor dem Auffüllen der Daten durchgeführt.
Schritt 4. Zugriff:
Dies ist der nächste Schritt der Implementierung. Wir verwenden die ausgefüllten Daten für die Abfrage zur Erstellung eines Berichts. Endbenutzer nutzen diesen Schritt, um die Daten mithilfe der Abfrage zu verstehen.
Schritt 5. Verwalten:
Dies ist die letzte Phase der Data-Mart-Implementierung, in der Aufgaben wie Zugriffsverwaltung, Systemoptimierung und -abstimmung, Verwaltung und Hinzufügen neuer Daten zum Data Mart sowie Planung von Wiederherstellungsszenarien zur Bewältigung etwaiger Fehlerszenarien behandelt werden.
Abschluss
Vielen Dank für das Lesen unseres Artikels. Wir hoffen, er hat Ihnen gefallen. Wenn Sie mehr erfahren möchten über Datenverwaltung, empfehlen wir Ihnen einen Besuch Gudu SQLFlow für weitere Informationen.
Als einer der die besten Datenherkunftstools Gudu SQLFlow ist heute auf dem Markt erhältlich und kann nicht nur SQL-Skriptdateien analysieren, Datenherkunft, und führen Sie eine visuelle Anzeige durch, ermöglichen Sie Benutzern aber auch, die Datenherkunft im CSV-Format bereitzustellen und eine visuelle Anzeige durchzuführen. (Veröffentlicht von Ryan am 22. Juni 2022)
Ein Kommentar
Hinterlasse einen Kommentar
Wenn Ihnen dies gefällt, sehen Sie sich bitte auch unsere anderen Artikel unten an:
[…] und Marketingabteilungen verwenden Data Marts, um Daten aus Quellen wie Kunden und […] zu sammeln.