Was ist Data Fabric?
Veröffentlicht: 2022-02-14Es wird festgestellt, dass Data Fabric ein unverzichtbares Element für alle datenzentrierten Organisationen ist. In den letzten Jahren war diese Terminologie für die Verwaltung von Unternehmensdaten und die Integration von Unternehmensdaten sehr relevant. Laut dem Analystenhaus Gartner gilt Data Fabric als einer der Top 10 Daten- und Analysetrends für 2021. Gartner schätzt außerdem, dass bis zum Jahr 2024 fast 25 % aller Datenmanagementanbieter eine umfassende Data Fabric-Lösung anbieten werden. Dies wird ein gewaltiger Sprung gegenüber dem derzeitigen Beitrag von 5 % sein.
- Data-Fabric-Definition
- Notwendigkeit einer Datenstruktur
- Die Architektur
- Schlüsselfähigkeiten
- Der Vergleich
- Anwendungsfälle von Data Fabric
- Vorteile von Data Fabric
Was ist Data Fabric?
Vereinfacht ausgedrückt ist Data Fabric eine vereinfachte, einheitliche und einzelne Architektur, die einen integrierten Satz von Technologien und Diensten umfasst. Diese Sammlung wurde erstellt, um integrierte und angereicherte Daten mit der richtigen Methodik an den richtigen Datenkunden und zur richtigen Zeit zu liefern; sowohl operative als auch analytische Arbeit ansprechen.
Data Fabric umfasst wichtige Datenmanagementtechnologien wie – Datenkatalog, Data Governance, Datenintegration, Datenpipelining und Datenorchestrierung.
Quelle: Gartner Inc. und/oder verbundene Unternehmen
Warum brauchen Sie Data Fabric?
Ein wesentlicher Grund, warum Unternehmen Data Fabrics benötigen, besteht darin, dass sie vielen Ausrichtungstreibern dienen, die geschäftlicher, technischer und organisatorischer Natur sind.
Gewerbliche Fahrer
- Für Geschäftstreibende hilft Data Fabric dabei, die Zeit für den Zugriff auf Erkenntnisse zu verkürzen und hilft bei einem schnelleren Prozess der fundierten Entscheidungsfindung. Dies geschieht durch schnelles Pipelining von Daten in Data Warehouses und Data Lakes.
- Data Fabric hilft auch bei der Bereitstellung einer 360-Grad-Echtzeitansicht aller Aspekte einer Geschäftseinheit wie Kunden, Lieferanten, Bestellungen, Lieferung, Produkt usw.
Organisatorische Treiber
- Data Fabric dient als gemeinsame Sprache zwischen Dateningenieuren und Datenkonsumenten und trägt so zu einer verbesserten Zusammenarbeit zwischen Geschäftsteams und Datenteams bei.
- Es gibt Self-Service-Datenzugriffsfunktionen, die es Verbrauchern ermöglichen, die benötigten Daten zu jedem beliebigen Zeitpunkt abzurufen.
Treiber für die Datenverwaltung
- Das Management der Datenvorbereitung hilft Data Scientists und anderen IT-Ressourcen, sich wiederholende Aufgaben rund um die Datenanreicherung, -transformation und -bereinigung zu vermeiden.
- Durch Data Fabric kann man mit jeder Methode auf jede Art von unternehmensweiten Daten zugreifen. Dazu gehören Massendatenbewegungen, Datenvirtualisierung und sogar APIs.
- Data Fabric rationalisiert und integriert auch die aktuellen Datenverwaltungstools, die in der Organisation verwendet werden, und optimiert andere redundante Tools, um die Kosteneffizienz zu verbessern.
Die Architektur von Data Fabric
Eine gut definierte Data-Fabric-Architektur ist von Natur aus modular und unterstützt eine groß angelegte Bereitstellung, die entweder Multi-Cloud, On-Premise oder sogar eine hybride Bereitstellung sein kann. Für eine Data-Fabric-Architektur reichen die Datenquellen von vielen Legacy-Systemen, die in Silos arbeiten, bis hin zu den neuesten Cloud-Umgebungen.
Das folgende Diagramm gibt eine Vorstellung von der Architektur der Datenstruktur
Quelle: Gartner Inc. und/oder verbundene Unternehmen
Zu den Verbrauchern von Data Fabrics gehören Data Scientists und Analysten, Marketinganalysten, Vertriebsanalysten und Ressourcen, die zusammen mit Cloud-Architekten am Datenschutz arbeiten.
Schlüsselfunktionen von Data Fabric
Im Folgenden sind die wichtigsten Funktionen aufgeführt, die Data Fabric unterstützt, wenn sie in eine einzige einheitliche Plattform integriert sind:
- Datenkatalog
Datenbestände zu kategorisieren, zu klassifizieren und in eine geeignete Bestandsstruktur einzufügen, um sie dadurch visuell darzustellen.
- Datentechnik
Entwicklung zuverlässiger Datenpipelines für analytische und operative Zwecke
- Datenamt
Um die Qualität der Daten sicherzustellen und auch die Vorschriften und Protokolle rund um Datenschutz, Datensicherheit und Skalierbarkeit einzuhalten
- Datenaufbereitung
Hier geht es darum, den Prozess des Datenflusses zu definieren, der auch Schritte zur Datenbereinigung, -anreicherung, -transformation und -validierung umfasst.
- Datenintegration & Datenbereitstellung
Dies beinhaltet das Extrahieren oder Abrufen von Daten aus jeder zuverlässigen Quelle und das anschließende Bereitstellen für den Datenkonsumenten zur weiteren Verarbeitung. Dies geschieht über APIs, ETL usw.
Über die oben erwähnten Kernfähigkeiten hinaus gibt es auch bestimmte Nicht-Kernfähigkeiten, die Data Fabric auf den Tisch bringt.
Diese sind wie folgt:
- Umfang, Volumen und Leistung von Daten
- Barrierefreiheit
- Verteilung
- Sicherheit
Vergleich zwischen Data Fabric/Data Lake/Datenbank für operative Workloads
Um Ihnen zu helfen, die Bedeutung von Data Fabrics zu verstehen, sehen wir uns einen Vergleich der Vor- und Nachteile verschiedener Datenquellen an
Verschiedene Datenquellen | Vorteile | Nachteile |
---|---|---|
Datensee, Datenlager | Unterstützen Sie Datenabfragen über viele strukturierte und unstrukturierte Daten hinweg | Nicht wirklich optimal für Einzeleingabe-Datenabfragen, die langsame Antworten verursachen. Unterstützt keine Live-Daten, daher sind kontinuierliche Datenaktualisierungen nicht zuverlässig. |
Keine SQL-Datenbank | Unterstützt lineare Skalierbarkeit durch verteilte Datenspeicherarchitektur | SQL wird nicht unterstützt, daher sind spezielle Fähigkeiten erforderlich |
Datenstruktur | • Vollständige SQL-Unterstützung • Unterstützt lineare Skalierbarkeit durch verteilte Datenspeicherarchitektur • Unterstützt hohe Parallelität mit Echtzeitleistung • Unterstützt komplexe Abfragen für einzelne Geschäftseinheiten • Unterstützt alle Arten von Integrationsmethoden • Flexible und dynamische Datenverwaltungsstruktur | N / A |
Während Data Fabric als überlegene Technologie für umfangreiche betriebliche Workloads dient, ist es auch eine Lösung, die als wechselseitige Technologie für Data Lake und Data Warehouses fungiert. Für eine solche Menge an Daten-Workloads kann eine Data Fabric:
1. Leiten Sie frische, vertrauenswürdige Daten für Offline-Analysezwecke in sie ein.
2. Erhalten Sie geschäftliche Einblicke von ihnen, um sie in operative Anwendungsfälle in Echtzeit einzubetten.
Anwendungsfälle von Data Fabric
Im gesamten Unternehmensbetrieb gibt es mehrere Anwendungsfälle, die eine hochskalierte und schnelle Datenarchitektur erfordern, die mehrere Transaktionen unterstützen kann. Zu diesen Beispielen gehören:
Bereitstellung einer 360-Grad-Kundensicht
Bereitstellung einer umfassenden und einheitlichen Ansicht der Kunden über CRM-Systeme, IVR oder ein Kunden-Self-Service-Portal.
Einhaltung der Datenschutzgesetze
Durch die Einführung eines flexiblen Workflows und einer Datenautomatisierungslösung, die die Compliance zwischen Personen, Systemen und Daten einhält.
Testdaten auf Anfrage
Unterstützung bei der Erstellung eines Test-Data-Warehouse und Weitergabe anonymer Testdaten an verschiedene Rechenzentren, wobei die vollständige Integrität gewahrt bleibt
Vorteile von Data Fabric
Es gibt eine Fülle von Vorteilen der Datenstruktur gegenüber einigen der traditionellen/alternativen Datenverwaltungsmethoden.
- Verbessertes Datenmanagement
- Erweiterte Datendienste
- Hohe Konsistenz, Verfügbarkeit und Langlebigkeit
- Extrem strenge Sicherheit
- Hochleistung
Abschließende Gedanken
Teams, die keine einzige Data-Fabric-Lösung für die Datenanalyse und eine andere Lösung für Operational Intelligence haben möchten. Sie ziehen es in der Regel vor, für beide eine einzige Datenstruktur zu haben.
Andere nützliche Ressourcen:
5 Schritte zur Schaffung einer datengesteuerten Kultur | TechFunnel
12 Tipps zum Aufbau von Datenkompetenz im Jahr 2022 | Techfunnel
Data Hub – Alles, was Sie wissen müssen | Techfunnel