Czas na sprawdzenie rzeczywistości AI/ML
Opublikowany: 2020-06-29Rohan Chandran jest dyrektorem ds. produktów w Infogroup.
Nauka o danych przeżywa swój moment w centrum uwagi, a ta ważna dyscyplina kładzie podwaliny pod nowe postępy w zakresie sztucznej inteligencji (AI) i uczenia maszynowego (ML) na co dzień. Jako ludzie i liderzy biznesu, nasz apetyt na najnowsze i najlepsze jest zawsze silny i nie jest to wyjątkiem w tym przypadku. Obecnie wszyscy chcą usprawnić swoje praktyki w zakresie analizy danych i wskazują na wykorzystanie AI i ML w swoich produktach i usługach.
Przesadzamy. Jesteśmy nadinżynieryjnymi rozwiązaniami. Zatrudniamy ludzi do prac, które okazują się nie do końca takie, jak w reklamach, a rok później albo rozwiązujemy zespoły, albo zastanawiamy się, dlaczego nie są zaangażowani i naturalnie atrybuują. W ten sposób napędzamy również ekosystem, który zachęca ludzi do podrabiania swoich referencji i szukania pracy w dziedzinie analityki danych, do której nie mają tak naprawdę kwalifikacji, co utrudnia prawdziwym pracodawcom zatrudnianie odpowiedniego talentu. Fałszywe gospodarki nie utrzymują się.
Powiem jednak jasno: nauka o danych jest istotną, a nawet rewolucyjną dziedziną we współczesnym krajobrazie biznesowym. Nowe techniki opracowywane w celu zrozumienia i operacjonalizacji danych, coraz częściej w sposób zautomatyzowany, mają charakter transformacyjny. Sposób, w jaki funkcjonujemy, zmienia się i musimy to robić nadal. To powiedziawszy, w naszym absolutnym pragnieniu bycia częścią historii AI i ML, toniemy w nieefektywności. Pozwólcie, że wyjaśnię.
Proste problemy najczęściej korzystają z prostych rozwiązań
YouTube jest pełen filmów wideo złożonych maszyn Rube Goldberg. (Jeśli ich nie widziałeś, gorąco polecam — godziny zabawy podczas ukrywania się w miejscu!) Chociaż te urządzenia są niezwykłe, są — z definicji — niepotrzebnie skomplikowanym rozwiązaniem prostego problemu. Takie podejście staje się niebezpieczne, gdy przekładamy je na świat biznesu, zaczynając od wyboru technologii („Upewnijmy się, że nasze produkty wykorzystują sztuczną inteligencję!”), a nie od problemu biznesowego.
Jako przykład rozważ moją 14-letnią Toyotę. Mam breloczek do kluczy, który leży w mojej kieszeni. Nawet jeśli mam torbę w każdej ręce, mogę podejść do samochodu i po prostu otworzyć drzwi. Nie wymaga dodatkowego wysiłku.
Potem pojawiły się telefony z wbudowaną komunikacją bliskiego zasięgu (NFC). Nagle producenci samochodów spieszyli, aby pokazać, jak można użyć telefonu z obsługą NFC do otwarcia drzwi samochodu. Aby to zrobić, wystarczyło wyjąć telefon z kieszeni, przyłożyć go do tagu NFC na oknie, a następnie otworzyć drzwi.
Ten przykład sprawdza wszystkie pudełka dla producentów samochodów, których zadaniem jest korzystanie z najnowszych technologii. Pozwala dyrektorowi wejść na scenę i porozmawiać o tym, jak użyć telefonu do odblokowania samochodu. Ale teraz muszę zatrzymać się przy samochodzie, odłożyć torby z zakupami, wyjąć telefon, położyć go, włożyć z powrotem do kieszeni, odebrać torby i wsiąść do samochodu. Moje eleganckie i bezproblemowe doświadczenie właśnie zostało usiane punktami bólu.
Niestety, robi to zbyt wiele osób, gdy próbują opracować złożone modele lub zbudować rozwiązanie AI, aby wykonać zadania, które mają dostępne proste rozwiązania. Robienie tego tylko ze względu na to jest marnowaniem zasobów i długoterminową szkodą gospodarczą. Najbardziej bystre organizacje wykazują powściągliwość i zdają sobie sprawę, że najlepsze rozwiązania często powstają w kontekście ograniczonych zasobów i zachęt, które są zgodne z rozwiązywaniem problemów klienta i wartości biznesowej, a nie technologicznych pól wyboru.
Koszt alternatywny: jeśli nie jest uszkodzony, nie naprawiaj go.
Przykład breloczka służy również do zilustrowania starego truizmu o niekoncentrowaniu wysiłku na rozwiązanych problemach. Jeśli starasz się skutecznie prowadzić firmę, chcesz być mocno skoncentrowany na wyróżniającej się wartości dodanej, którą zapewniasz. Tam, gdzie problemy zostały rozwiązane przez innych — a nie oszukujmy się, większość naszych problemów nie jest tak wyjątkowa, jak moglibyśmy chcieć wierzyć — wykorzystują ich pracę. Stań na ramionach olbrzymów.
Zamiast budować zespół naukowców zajmujących się danymi, aby rozwiązywać wszystko we własnym zakresie, najpierw zbadaj dostępność rozwiązań typu open source lub rozwiązań licencjonowanych w innym miejscu. Ponieważ sztuczna inteligencja i uczenie maszynowe dojrzewają jako dyscypliny, przekonujemy się, że wielu największych graczy w tej dziedzinie — w tym Amazon, Google i inni — zainwestowało już dużo w tworzenie niezawodnych algorytmów i narzędzi, które można łatwo zastosować lub dostosować do rozwiązywania wszelkich liczba wyzwań związanych z danymi. Nie ma nic do zyskania, zatrudniając własny zespół 50 naukowców zajmujących się danymi, aby rozwiązać problem, który można łatwo rozwiązać za pomocą gotowego rozwiązania. (Dla czytelników nastawionych technicznie jest interesujący artykuł Thomasa Nielda, który omawia konkretny przykład systemów planowania, dla których istnieje kilka istniejących algorytmów, które rozwiązują naprawdę skutecznie, eliminując potrzebę inwestowania w ponowne wynalazki.)
Jakość danych to podstawa. Najpierw zrób to dobrze.
Przede wszystkim, gdy zastanawiasz się nad inwestowaniem w naukę o danych, a bardziej w ML i/lub sztuczną inteligencję, konieczne jest uświadomienie sobie, że podstawą każdego potencjalnego pomyślnego wyniku jest jakość danych, które masz dostępne dla swojego zespołu i jej modele lub narzędzia. Śmieci wchodzą, śmieci wychodzą, jak to się mówi.
Zespół doktorów może opracować dla Ciebie system rozpoznawania obrazów oparty na uczeniu maszynowym, który przewyższa nawet to, co mają dziś wielkie armaty. Ale jeśli wytresujesz go za pomocą siedmiu zdjęć psów oznaczonych jako koty, jedyne, co zrobi, to spektakularna porażka.
Jakość oczywiście sięga głębiej, a każdy godny uwagi analityk danych lub inżynier danych będzie wymagał, abyś najpierw się tutaj skupił. Gdy to robisz, dokładność, precyzja, przypomnienie, terminowość i pochodzenie są ważnymi czynnikami, ale często płaci się niewiele więcej niż tylko gołosłownym określeniem, co stanowi jakość w twoim konkretnym kontekście. Podobnie jak w przypadku wskaźników próżności, które firmy uwielbiają wymieniać (pomyśl „30 milionów osób pobrało moją aplikację”, co nie mówi ci, ilu z nich faktycznie jej używa), jeśli nie rozważysz odpowiednio, co składa się na jakość, wygrałeś nie osiągnąć tego.
Rozważ zestaw danych, który dotyczy obecności dzieci w gospodarstwie domowym i ich wieku. Jeśli sprzedajesz niemowlęce śpioszki rodzicom noworodków, to terminowość i precyzja mają kluczowe znaczenie. Twój rynek docelowy jest napięty, a jeśli spóźnisz się o kilka tygodni, chybiłeś. Jednakże, jeśli sprzedajesz rodzinne gry planszowe, może nie mieć znaczenia, jeśli spóźnisz się o kilka lat, jeśli twoja dokładność jest dobra. To te same dane, ale inna ocena jakości.
AI i ML będą fundamentalną częścią naszej przyszłości. Nie twierdzę, że dzisiejsze przedsiębiorstwa nie powinny zatrudniać najlepszych w swojej klasie naukowców zajmujących się danymi. Mówię po prostu, że liderzy firmy muszą upewnić się, że zatrudniają zgodnie z dobrze zdefiniowaną strategią i potrzebami oraz zapewnić, że mają czyste, dobrze (i etycznie) pozyskiwane dane, które są wystarczająco merytoryczne, aby uzasadnić znaczące modelowanie. Koncentrując się w ten sposób, możesz mieć pewność, że zasoby organizacji — a także czas i talent analityków danych — są dobrze wykorzystywane.