Jak zmienić surowe dane w zasób dla Twojej firmy?

Opublikowany: 2022-10-10

Wiele firm dysponuje dużą ilością danych, ale nie wie, co z nimi zrobić. Mogą to być informacje o klientach, numery telefonów organizacji, dane z urządzeń śledzących GPS i tak dalej. Kiedy dane są zbierane, porządkowane i analizowane, stają się przydatne.

Na przykład firma zajmuje się dostarczaniem różnych paczek i ładunków do osób fizycznych i firm. W trakcie realizacji zamówień menedżerowie otrzymują codziennie dane dotyczące wielkości/wagi paczek, ich kosztów oraz odległości, jakie pokonują kierowcy. Wszystkie te informacje bez analiz nie mają żadnej wartości.

Przy odrobinie analizy statystycznej możesz określić, kiedy następuje wzrost przesyłek, jaki jest rozkład odległości, jakie artykuły są najczęściej zamawiane i nie tylko. Na podstawie tych danych dział reklamy firmy może tworzyć spersonalizowane kampanie dla grupy docelowej. Może też pomóc np. przygotować kierowców na gorące pory roku (jak na początku jesieni) lub zatrudnić ich więcej, zachęcać do kupowania nowych ciężarówek i tak dalej.

Inny przykład. Firma transportująca towary codziennie zbiera dane od kierowców samochodów — systemy telematyczne śledzą liczbę przejechanych kilometrów i zużycie paliwa. Usystematyzując te informacje, możesz zwiększyć wydajność podróży, obliczyć bardziej ekonomiczne i bezpieczniejsze trasy i tak dalej — robią to dostawcy oprogramowania w logistyce, tacy jak Twinslash.

W opiece zdrowotnej przydatne dane mogą również dać ogromny impuls do operacji. Przetwarzanie i analiza dokumentacji medycznej i danych laboratoryjnych (zwłaszcza danych obrazowych) pozwala lekarzom opracowywać strategie, które doprowadzą do dokładniejszych diagnoz i nowych sposobów leczenia, z algorytmami uczenia maszynowego dostrzegającymi wzorce i tendencje, które ludzie przeoczają.

Niewątpliwie dane to atut firmy. Pomaga poprawić konkurencyjność na rynku i przedefiniować strategie biznesowe. Jednak zanim surowe dane — tylko różne wartości zbierane przez system, nieustrukturyzowane i niezorganizowane — staną się użyteczne, muszą zostać przetworzone.

Zrozum surowe dane za pomocą ETL Pipeline

ETL (Extract-Transform-Load) to technologia przeznaczona do zbierania i przekształcania danych z różnych źródeł oraz przesyłania ich do pośredniej bazy pamięci masowej. Ta baza danych może być następnie wykorzystywana jako hurtownia danych/pula danych, a dane z nich mogą być wprowadzane do algorytmów uczenia maszynowego/AI w celu analizy, prognozowania itp.

Jak działa metoda ETL? Na początek dane są pobierane z różnych źródeł: stron internetowych, baz danych CRM, SQL i NoSQL, e-maili itd. — w zależności od tego, jakie dane posiada firma.

Następnie dane są konwertowane i sortowane. Podczas sortowania algorytmy automatyzacji lub osoby, które sortują ręcznie, pozbywają się wszystkich duplikatów, niepotrzebnych danych itp. ETL doskonale nadaje się do przetwarzania i ujawniania spostrzeżeń z surowych danych w starszych systemach, dlatego ETL jest tak przydatny do wykorzystania w branży turystycznej , opieka zdrowotna, fintech i inne dziedziny, które są wyciszone i często opierają się cyfrowej transformacji.

Następnie dane są ładowane do systemu docelowego — ponownie, ręcznie lub automatycznie.

Sans titre 12

Możesz użyć ETL:

  • czy wszystkie dane źródłowe pochodzą z relacyjnych baz danych, czy też wymagają dokładnego oczyszczenia przed załadowaniem do systemu docelowego;
  • podczas pracy ze starszymi systemami i relacyjnymi bazami danych;
  • gdy firma musi starannie chronić dane i przestrzegać różnych standardów zgodności, takich jak HIPAA, CCPA lub GDPR (kolejny duży plus dla branży medycznej i fintech).

Potok ETL jest sprawdzony i niezawodny, ale jest dość powolny i wymaga dodatkowych narzędzi: Informatica, Cognos, Oracle i IBM.

Szybsza inżynieria danych dzięki nowemu potokowi ELT

Ilość informacji stale rośnie. A metodologia ETL nie zawsze może zaspokoić potrzeby przetwarzania ogromnych zbiorów danych do celów analizy biznesowej.

Dlatego pojawiła się nowa, nowocześniejsza metoda – ELT (Extract-Load-Transform). To także gromadzenie, czyszczenie, porządkowanie i ładowanie danych. Różni się jednak od ETL tym, że dane trafiają bezpośrednio do hurtowni, gdzie mogą być sprawdzane, strukturyzowane i przekształcane na różne sposoby. Informacje mogą być tam przechowywane przez czas nieokreślony. Dlatego metoda ETL jest bardziej elastyczna i szybsza. Do przeprowadzenia takiego procesu potrzebne będą narzędzia: Kafka, Hevo data, Talend.

Kiedy używać ELT:

  • kiedy potrzebujesz szybko (!) zebrać dane i podjąć decyzje, aby osiągnąć swoje cele biznesowe, co sprawia, że ​​ELT jest bardzo dobry do dokonywania wyborów z danych marketingowych przy np. skalowaniu startupów/repozycjonowaniu biznesu.
  • gdy firma stale otrzymuje dużą ilość nieustrukturyzowanych informacji;
  • masz do czynienia z projektami chmurowymi lub architekturami hybrydowymi.

ELT to bardziej nowoczesna metoda, która stopniowo zastępuje ETL. Pozwala szybko skalować projekty na konkurencyjnych rynkach. ELT jest ekonomiczny, elastyczny i wymaga minimalnej konserwacji. Nadaje się dla firm różnych branż i wielkości.

Przykłady wykorzystania potoków danych w celu podejmowania lepszych decyzji

Wiele dużych firm udowodniło, że analitykę danych, którą umożliwia ugruntowany potok danych, można z powodzeniem wykorzystywać do realizacji różnych celów biznesowych.

Doskonałym przykładem wykorzystania potoku danych w e-commerce jest silnik rekomendacji Amazona . Amazon wdrożył unikalny, dynamiczny model rekomendacji do swojego produktu e-commerce. Silnik rekomendacji Amazon wchodzi w interakcję z kupującym na wszystkich etapach podróży przez stronę internetową, sugerując w ten sposób docelowy produkt i zachęcając do zakupów.

Firma opracowała i wdrożyła algorytm, który dopasowuje produkty już zakupione i ocenione przez użytkownika do podobnych lub powiązanych pozycji handlowych. Silnik układa je w listę, którą należy polecić. System opiera się na wielu jawnych i niejawnych danych: zakupach użytkownika, ocenach produktów, historii przeglądania witryny i dodawaniu do koszyka, co umożliwia systemowi generowanie dokładnych spersonalizowanych rekomendacji.

Przykładem użycia dla podróży i transportu byłby silnik predykcyjny Otonomi . Otonomi, firma działająca w branży transportowej, opracowała swoje rozwiązanie parametryczne w oparciu o dane OAG. Umożliwia Otonomi określanie i przewidywanie opóźnień samolotów w czasie, dokładniejsze obliczanie cen i obliczanie możliwego ryzyka przy użyciu danych dotyczących podróży dostarczonych przez OAG. Dzięki szybkiemu przetwarzaniu danych i generowaniu spostrzeżeń w celu efektywnego zarządzania zakłóceniami, firmie udało się w dużym stopniu obniżyć koszty administracyjne i operacyjne.

Sans titre 13

Mówiliśmy już o tym, jak dobre wykorzystanie danych dotyczących zdrowia może pozytywnie wpłynąć na wynik pacjenta, więc jest to również korzyść. Firmy rolnicze mogą wykorzystywać dane o pogodzie, cenach towarów i komponentów do maszyn rolniczych, aby usprawnić proces zbiorów. Firmy ubezpieczeniowe mogą wykorzystywać historie roszczeń klientów do wykrywania oszustw. W mediach anonimowe dane klientów mogą być wykorzystywane do identyfikacji wzorców zachowań użytkowników, aby dowiedzieć się, gdzie można zmienić UX, aby poprawić konwersje.

Uwagi końcowe: nie zapomnij o dostępności i umiejętności korzystania z danych

Wszyscy w firmie muszą rozumieć wyniki analizy danych. Załóżmy na przykład, że wdrażasz potok danych w swojej firmie transportowej. Jeśli chcesz, aby Twoja analiza danych była naprawdę użyteczna, kierowcy, menedżerowie, specjaliści ds. obsługi klienta i inne osoby, które nie są analitykami danych, muszą być w stanie dostrzec wnioski z danych i wiedzieć, skąd pochodzą. Musisz pamiętać, że analiza danych jest przydatna, gdy łatwo ją znaleźć i zrozumieć. Narzędzie do przetwarzania danych, które rozumieją tylko naukowcy zajmujący się danymi, jest bezwartościowe jako narzędzie do analizy biznesowej.