Ce este Data Fabric?
Publicat: 2022-02-14Se afirmă că structura de date este un element obligatoriu pentru toate organizațiile care sunt centrate pe date. În ultimii câțiva ani, această terminologie a fost destul de relevantă pentru managementul datelor de întreprindere și integrările de date ale întreprinderii. Potrivit companiei de analiză Gartner, data fabric este considerată a fi primele 10 tendințe de date și analize pentru 2021. Gartner estimează, de asemenea, că până în anul 2024, aproape 25% din fiecare furnizor de management de date va oferi o soluție cuprinzătoare de data fabric. Acesta va fi un salt uriaș față de contribuția actuală de 5%.
- Definiție Data Fabric
- Nevoia de țesătură de date
- Arhitectura
- Capabilitati cheie
- Comparația
- Cazuri de utilizare ale Data Fabric
- Avantajele Data Fabric
Ce este data fabric?
Pentru a spune în termeni simpli, structura de date este o arhitectură simplificată, unificată și unică, care cuprinde un set integrat de tehnologii și servicii. Această colecție este creată pentru a furniza date integrate și îmbogățite folosind metodologia corectă, clientului de date potrivit și la momentul potrivit; abordând atât munca operațională, cât și cea analitică.
Fabrica de date cuprinde tehnologii cheie de gestionare a datelor, cum ar fi – catalogul de date, guvernarea datelor, integrarea datelor, pipeliningul de date și orchestrarea datelor.
Sursa: Gartner Inc. și/sau afiliații săi
De ce aveți nevoie de material de date?
Un motiv fundamental pentru care organizațiile au nevoie de țesătură de date este că acesta servește mulți factori de aliniere care sunt de natură comercială, tehnică și organizațională.
Drivere de afaceri
- Pentru conducătorii de afaceri, structura de date ajută la reducerea timpului de acces la informații și ajută la un proces mai rapid de luare a deciziilor în cunoștință de cauză. Acest lucru se realizează prin pipeline de date în depozite de date și lacuri de date, rapid.
- Fabrica de date ajută, de asemenea, la furnizarea unei imagini de 360 de grade în timp real a tuturor aspectelor unei entități comerciale, cum ar fi clienții, vânzătorii, comenzile, livrarea, produsul etc.
Drivere organizaționale
- Fabrica de date servește ca limbaj comun între inginerii de date și consumatorii de date, contribuind astfel la o colaborare îmbunătățită între echipele de afaceri și echipele de date.
- Există capabilități de acces la date cu autoservire care permit consumatorilor să obțină datele de care au nevoie și în orice moment dat.
Drivere de gestionare a datelor
- Gestionarea pregătirii datelor ajută oamenii de știință ai datelor și alte resurse IT să evite întreprinderea oricărui fel de sarcini repetitive legate de îmbogățirea, transformarea și curățarea datelor.
- Prin intermediul fabricii de date, se poate obține acces la orice tip de date la nivel de întreprindere folosind orice metodă. Aceasta include mișcarea în vrac a datelor, virtualizarea datelor și chiar API-uri.
- Fabrica de date eficientizează și integrează, de asemenea, instrumentele curente de gestionare a datelor utilizate în organizație și le optimizează pe altele redundante pentru îmbunătățirea eficienței costurilor.
Arhitectura Data Fabric
O arhitectură de țesătură de date bine definită este de natură modulară și acceptă implementarea la scară largă care poate fi fie multi-cloud, on-premise, fie chiar o implementare hibridă. Pentru o arhitectură a fabricii de date, sursele de date variază de la multe sisteme vechi care funcționează în siloz până la cele mai recente medii cloud.
Următoarea diagramă oferă o idee despre arhitectura fabricii de date
Sursa: Gartner Inc. și/sau afiliații săi
Consumatorii de țesătură de date includ oameni de știință și analiști de date, analiști de marketing, analiști de vânzări și resurse care lucrează la confidențialitatea datelor împreună cu arhitecții cloud.
Capacitățile cheie ale fabricii de date
Următoarele sunt setul de capabilități cheie pe care tehnologia de date le acceptă atunci când este integrată într-o singură platformă unificată:
- Catalog de date
Pentru a clasifica, clasifica și pune activele de date într-o structură de inventar adecvată, prezentându-le astfel vizual.
- Ingineria datelor
Pentru a dezvolta conducte de date fiabile în scopuri analitice și operaționale
- Guvernarea datelor
Pentru a asigura calitatea datelor și, de asemenea, pentru a respecta reglementările și protocoalele privind confidențialitatea datelor, siguranța datelor și scalabilitate
- Pregătirea datelor
Este vorba despre definirea procesului de flux de date, care include și pași implicați în curățarea, îmbogățirea, transformarea și validarea datelor.
- Integrarea datelor și livrarea datelor
Aceasta implică extragerea sau preluarea datelor din orice sursă de încredere și apoi punerea lor la dispoziție pentru consumatorul de date pentru prelucrare ulterioară. Acest lucru se face prin API-uri, ETL etc.
Pe lângă capacitățile de bază menționate mai sus, există și anumite capacități non-core, pe care materialul de date le aduce la masă.
Acestea sunt după cum urmează:
- Scara, volumul și performanța datelor
- Accesibilitate
- Distributie
- Securitate
Comparație între Data Fabric/Data Lake/Database pentru sarcinile de lucru operaționale
Pentru a vă ajuta să înțelegeți importanța fabricii de date, permiteți-ne să analizăm o comparație în jurul avantajelor și dezavantajelor diferitelor surse de date
Diverse surse de date | Pro | Contra |
---|---|---|
Data Lake, Data Warehouse | Sprijină interogări de date pentru multe date structurate și nestructurate | Nu este chiar optim pentru interogări de date cu o singură intrare care provoacă răspunsuri lente. Nu acceptă date live, așa că actualizările continue ale datelor nu sunt de încredere. |
Fără bază de date SQL | Suportă scalabilitate liniară prin arhitectura de depozit de date distribuită | Nu acceptă SQL, așa că necesită abilități specializate |
Fabrica de date | • Suport complet SQL • Suportă scalabilitate liniară prin arhitectura de depozit de date distribuită • Suportă concurență ridicată cu performanță în timp real • Suportă interogări complexe pentru entități comerciale individuale • Suportă toate tipurile de metodologie de integrare • Structură flexibilă și dinamică de guvernare a datelor | N / A |
În timp ce țesătura de date servește ca o tehnologie superioară pentru sarcinile operaționale la scară înaltă, este, de asemenea, o soluție care acționează ca o tehnologie reciprocă pentru lacul de date și depozitele de date. Pentru o asemenea cantitate de încărcături de lucru de date, o fabrică de date poate:
1. Introduceți date proaspete și de încredere în ele, în scopuri de analiză offline.
2. Primiți informații despre afaceri de la aceștia, pentru a le încorpora în cazuri de utilizare operaționale în timp real.
Cazuri de utilizare ale Data Fabric
În cadrul operațiunilor de întreprindere, există mai multe cazuri utilizate care necesită o arhitectură de date la scară mare și de mare viteză, care este capabilă să suporte mai multe tranzacții. Aceste exemple includ:
Oferă o viziune la 360 de grade pentru client
Oferă o vizualizare cuprinzătoare și unică a clienților prin sisteme CRM, IVR sau un portal de autoservire pentru clienți.
Respectarea legilor privind confidențialitatea datelor
Prin adoptarea unui flux de lucru flexibil și a unei soluții de automatizare a datelor care respectă conformitatea dintre oameni, sisteme și date.
Date de testare la cerere
Ajutând la crearea unui depozit de date de testare și partajarea datelor de testare anonime către diferite centre de date, menținând integritatea totală
Avantajele Data Fabric
Există o multitudine de avantaje ale fabricii de date față de unele dintre metodologiile tradiționale/alternative de gestionare a datelor.
- Gestionare îmbunătățită a datelor
- Servicii de date extinse
- Nivel ridicat de consistență, disponibilitate și durabilitate
- Securitate extrem de strictă
- Performanta ridicata
Gânduri finale
Echipele care nu doresc să aibă o singură soluție de fabrică de date pentru analiza datelor și o altă soluție pentru inteligența operațională. De obicei, ei preferă să aibă un singur material de date pentru ambele.
Alte resurse utile:
5 pași pentru a crea o cultură bazată pe date | TechFunnel
12 sfaturi pentru construirea alfabetizării datelor în 2022 | Techfunnel
Data Hub – Tot ce trebuie să știți | Techfunnel