Co to jest sieć danych?
Opublikowany: 2022-02-14Mówi się, że struktura danych jest niezbędnym elementem dla wszystkich organizacji, które są zorientowane na dane. Od kilku lat ta terminologia jest dość istotna w przypadku zarządzania danymi przedsiębiorstwa i integracji danych przedsiębiorstwa. Według firmy analitycznej Gartner, data fabric jest uważana za 10 największych trendów w zakresie danych i analiz w 2021 roku. Gartner szacuje również, że do roku 2024 prawie 25% każdego dostawcy usług zarządzania danymi będzie dostarczać kompleksowe rozwiązanie Data Fabric. Będzie to ogromny skok w stosunku do obecnego wkładu 5%.
- Definicja sieci danych
- Potrzeba tkaniny danych
- Architektura
- Kluczowe możliwości
- Porównanie
- Przypadki użycia Data Fabric
- Zalety Data Fabric
Co to jest tkanina danych?
Mówiąc prościej, struktura danych to uproszczona, ujednolicona i pojedyncza architektura, która obejmuje zintegrowany zestaw technologii i usług. Ten zbiór jest tworzony w celu dostarczenia zintegrowanych i wzbogaconych danych przy użyciu właściwej metodologii, do właściwego klienta danych i we właściwym czasie; zajmujących się zarówno pracami operacyjnymi, jak i analitycznymi.
Tkanina danych obejmuje kluczowe technologie zarządzania danymi, takie jak – katalog danych, zarządzanie danymi, integracja danych, potokowanie danych i orkiestracja danych.
Źródło: Gartner Inc. i/lub jej podmioty stowarzyszone
Dlaczego potrzebujesz Data Fabric?
Podstawowym powodem, dla którego organizacje potrzebują struktury danych, jest to, że obsługuje ona wiele czynników wyrównywania o charakterze biznesowym, technicznym i organizacyjnym.
Kierowcy biznesowi
- Dla kierowców biznesowych struktura danych pomaga w skróceniu czasu dostępu do spostrzeżeń i pomaga w szybszym procesie podejmowania świadomych decyzji. Odbywa się to poprzez szybkie przesyłanie danych do hurtowni danych i jezior danych.
- Tkanina danych pomaga również w dostarczaniu w czasie rzeczywistym 360-stopniowego widoku wszystkich aspektów jednostki biznesowej, takich jak klienci, dostawcy, zamówienia, dostawa, produkt itp.
Kierowcy organizacyjni
- Sieć danych służy jako wspólny język między inżynierami danych a konsumentami danych, pomagając w ten sposób usprawnić współpracę między zespołami biznesowymi i zespołami danych.
- Istnieją możliwości samoobsługowego dostępu do danych, które umożliwiają konsumentom uzyskanie potrzebnych danych w dowolnym momencie.
Sterowniki zarządzania danymi
- Zarządzanie przygotowywaniem danych pomaga analitykom danych i innym zasobom IT uniknąć podejmowania wszelkiego rodzaju powtarzalnych zadań związanych ze wzbogacaniem, przekształcaniem i czyszczeniem danych.
- Poprzez strukturę danych można uzyskać dostęp do dowolnego rodzaju danych z całego przedsiębiorstwa przy użyciu dowolnej metody. Obejmuje to masowe przenoszenie danych, wirtualizację danych, a nawet interfejsy API.
- Data fabric usprawnia również i integruje obecne narzędzia do zarządzania danymi używane w organizacji oraz optymalizuje inne nadmiarowe w celu poprawy efektywności kosztowej.
Architektura Data Fabric
Dobrze zdefiniowana architektura sieci szkieletowej danych ma charakter modułowy i obsługuje wdrażanie na dużą skalę, które może być wdrożeniem wielochmurowym, lokalnym lub nawet hybrydowym. W przypadku architektury Data Fabric źródła danych obejmują wiele starszych systemów działających w silosach, a także najnowsze środowiska chmurowe.
Poniższy diagram daje wyobrażenie o architekturze struktury danych
Źródło: Gartner Inc. i/lub jej podmioty stowarzyszone
Konsumenci sieci danych to naukowcy i analitycy danych, analitycy marketingowi, analitycy sprzedaży oraz zasoby, które pracują nad prywatnością danych wraz z architektami chmury.
Kluczowe możliwości struktury danych
Poniżej przedstawiono zestaw kluczowych funkcji obsługiwanych przez strukturę danych, gdy jest ona zintegrowana z pojedynczą, ujednoliconą platformą:
- Katalog danych
Aby kategoryzować, klasyfikować i umieszczać zasoby danych w odpowiedniej strukturze inwentarza, a tym samym prezentować je wizualnie.
- Inżynieria danych
Opracowanie niezawodnych potoków danych do celów analitycznych i operacyjnych
- Zarządzanie danymi
Aby zapewnić jakość danych, a także przestrzegać przepisów i protokołów dotyczących prywatności danych, bezpieczeństwa danych i skalowalności
- Przygotowywanie danych
Chodzi o zdefiniowanie procesu przepływu danych, który obejmuje również kroki związane z czyszczeniem danych, wzbogacaniem, transformacją i walidacją danych.
- Integracja i dostarczanie danych
Obejmuje to wyodrębnianie lub pobieranie danych z dowolnego wiarygodnego źródła, a następnie udostępnianie ich konsumentowi danych do dalszego przetwarzania. Odbywa się to za pośrednictwem interfejsów API, ETL itp.
Poza podstawowymi możliwościami, jak wspomniano powyżej, istnieją również pewne niezwiązane z podstawowymi możliwościami, które struktura danych przenosi do tabeli.
Są to:
- Skala, objętość i wydajność danych
- Dostępność
- Dystrybucja
- Bezpieczeństwo
Porównanie Data Fabric/Data Lake/Baza danych dla obciążeń operacyjnych
Aby pomóc Ci zrozumieć znaczenie struktury danych, przyjrzyjmy się porównaniu zalet i wad różnych źródeł danych
Różne źródła danych | Plusy | Cons |
---|---|---|
Data Lake, hurtownia danych | Obsługa zapytań o dane w wielu danych strukturalnych i niestrukturalnych | Niezbyt optymalne dla zapytań o dane pojedynczego wpisu, które powodują powolne odpowiedzi. Nie obsługuje danych na żywo, więc ciągłe aktualizacje danych nie są niezawodne. |
Brak bazy danych SQL | Obsługuje liniową skalowalność dzięki rozproszonej architekturze magazynu danych | Nie obsługuje SQL, więc wymaga specjalistycznych umiejętności |
Tkanina danych | • Pełna obsługa SQL • Obsługuje skalowalność liniową dzięki rozproszonej architekturze magazynu danych • Obsługuje wysoką współbieżność z wydajnością w czasie rzeczywistym • Obsługuje złożone zapytania dla pojedynczych podmiotów gospodarczych • Obsługuje wszystkie rodzaje metodologii integracji • Elastyczna i dynamiczna struktura zarządzania danymi | Nie dotyczy |
Chociaż sieć danych służy jako doskonała technologia dla obciążeń operacyjnych na dużą skalę, jest to również rozwiązanie, które działa jako technologia wzajemna dla jeziora danych i hurtowni danych. W przypadku takiej ilości obciążeń danych sieć szkieletowa danych może:
1. Przesyłaj do nich świeże, zaufane dane do celów analitycznych offline.
2. Otrzymuj od nich spostrzeżenia biznesowe, aby móc je osadzić w operacyjnych przypadkach użycia w czasie rzeczywistym.
Przypadki użycia Data Fabric
W operacjach przedsiębiorstwa istnieje wiele przypadków, które wymagają dużej i szybkiej architektury danych, która jest w stanie obsłużyć wiele transakcji. Te przykłady obejmują:
Dostarczanie 360-stopniowego widoku klienta
Dostarczanie kompleksowego i jednolitego widoku klientów za pośrednictwem systemów CRM, IVR czy portalu samoobsługowego klienta.
Przestrzeganie przepisów dotyczących prywatności danych
Dzięki zastosowaniu elastycznego przepływu pracy i rozwiązania do automatyzacji danych, które jest zgodne ze zgodnością między ludźmi, systemami i danymi.
Testuj dane na żądanie
Pomoc w tworzeniu testowej hurtowni danych i udostępnianiu anonimowych danych testowych różnym centrom danych z zachowaniem całkowitej integralności
Zalety Data Fabric
Tkanina danych ma wiele zalet w porównaniu z niektórymi tradycyjnymi/alternatywnymi metodologiami zarządzania danymi.
- Ulepszone zarządzanie danymi
- Rozszerzone usługi danych
- Wysoki poziom spójności, dostępności i trwałości
- Niezwykle szczelne zabezpieczenie
- Wysoka wydajność
Końcowe przemyślenia
Zespoły, które nie chcą mieć pojedynczego rozwiązania Data Fabric do analizy danych i innego rozwiązania do analizy operacyjnej. Zwykle wolą mieć jedną strukturę danych dla obu.
Inne przydatne zasoby:
5 kroków do stworzenia kultury opartej na danych | TechFunnel
12 wskazówek dotyczących budowania umiejętności korzystania z danych w 2022 r. | Techfunnel
Data Hub – wszystko, co musisz wiedzieć | Techfunnel