È tempo di un controllo della realtà AI/ML

Pubblicato: 2020-06-29

Rohan Chandran è il Chief Product Officer di Infogroup.

La scienza dei dati sta vivendo il suo momento alla ribalta, con questa disciplina vitale che getta le basi per i nuovi progressi quotidiani dell'intelligenza artificiale (AI) e dell'apprendimento automatico (ML). Come esseri umani e come leader aziendali, il nostro appetito per l'ultimo e il più grande è sempre forte, e in questo caso non fa eccezione. Al momento, tutti stanno cercando di aumentare le proprie pratiche di data science e puntare all'uso di AI e ML nei loro prodotti e servizi.

Stiamo esagerando. Siamo soluzioni di ingegneria eccessiva. Stiamo assumendo persone per lavori che risultano non essere così pubblicizzati e poi o sciogliendo i team un anno dopo, o chiedendoci perché non sono coinvolti e si stanno naturalmente logorando. In tal modo, stiamo anche alimentando un ecosistema che incoraggia le persone a gonfiare le proprie credenziali e cercare lavori nell'ambito della scienza dei dati per i quali non sono realmente qualificati, rendendo più difficile per i veri datori di lavoro assumere il talento giusto. Le false economie non reggono.

Vorrei essere chiaro però: la scienza dei dati è un campo essenziale e persino rivoluzionario nel panorama aziendale moderno. Le nuove tecniche sviluppate per comprendere e rendere operativi i dati, sempre più in modo automatizzato, sono trasformative. Il modo in cui operiamo sta cambiando e dobbiamo continuare a farlo. Detto questo, nel nostro assoluto desiderio di far parte della storia dell'IA e del ML, ci stiamo affogando nell'inefficienza. Mi permetta di spiegare.

Problemi semplici Il più delle volte traggono vantaggio da soluzioni semplici

YouTube è pieno di video di complesse macchine Rube Goldberg. (Se non li hai visti, ti consiglio vivamente: ore di divertimento mentre ti rifugi sul posto!) Per quanto straordinari siano questi dispositivi, sono, per definizione, una soluzione inutilmente complessa a un problema semplice. Questo approccio diventa pericoloso quando lo traduciamo nel mondo degli affari partendo da una scelta tecnologica ("Assicuriamoci che i nostri prodotti utilizzino l'IA!") piuttosto che dal problema aziendale.

Ad esempio, considera la mia Toyota di 14 anni. Ho un portachiavi che mi sta in tasca. Anche se ho una borsa in ogni mano, posso avvicinarmi alla macchina e aprire la portiera. Nessuno sforzo aggiuntivo richiesto.

Poi sono arrivati ​​i telefoni con Near Field Communication (NFC) integrata. All'improvviso, le case automobilistiche si sono affrettate a mostrare come utilizzare il telefono abilitato NFC per aprire la portiera dell'auto. Per fare ciò, devi semplicemente estrarre il telefono dalla tasca, tenerlo vicino al tag NFC sul finestrino e quindi aprire lo sportello.

Questo esempio seleziona tutte le caselle per le case automobilistiche incaricate di utilizzare le ultime tecnologie. Consente a un dirigente di salire sul palco e parlare di come utilizzare il telefono per sbloccare l'auto. Ma ora devo fermarmi alla macchina, posare le buste della spesa, tirare fuori il telefono, alzarlo, rimetterlo in tasca, raccogliere le borse e poi salire in macchina. La mia esperienza elegante e senza soluzione di continuità è appena diventata crivellata di punti dolenti.

Questo è purtroppo ciò che fanno troppe persone quando cercano di sviluppare modelli complessi, o costruire una soluzione di intelligenza artificiale, per eseguire attività che hanno soluzioni semplici disponibili. Farlo solo per il gusto di farlo è uno spreco di risorse e un danno economico a lungo termine. Le organizzazioni più esperte mostrano moderazione e riconoscono che le soluzioni migliori spesso sorgono nel contesto di risorse e incentivi scarsi che si allineano con la risoluzione del valore del cliente e dell'azienda, piuttosto che le caselle di controllo tecnologiche.

Costo opportunità: se non è rotto, non aggiustarlo.

L'esempio del portachiavi serve anche a illustrare la vecchia verità sul non concentrare gli sforzi sui problemi risolti. Se stai cercando di gestire un'attività in modo efficiente, allora vuoi concentrarti strettamente sul valore aggiunto distinto che fornisci. Laddove i problemi sono stati risolti da altri - e ammettiamolo, la maggior parte dei nostri problemi non sono così unici come potremmo voler credere - sfrutta il loro lavoro. Stare sulle spalle dei giganti.

Invece di creare un team di data scientist per risolvere tutto internamente, esplora prima la disponibilità di soluzioni open source o con licenza altrove. Man mano che l'intelligenza artificiale e l'apprendimento automatico maturano come discipline, stiamo scoprendo che molti dei più grandi attori in questo settore, inclusi Amazon, Google e altri, hanno già investito molto nella creazione di algoritmi e strumenti robusti che possono essere facilmente impiegati o adattati per risolvere qualsiasi problema. numero di problemi relativi ai dati. Non c'è niente da guadagnare impiegando il proprio team di 50 data scientist per risolvere un problema che può essere prontamente affrontato con una soluzione pronta all'uso. (Per i lettori più tecnici, c'è un articolo interessante di Thomas Nield che illustra un esempio specifico di sistemi di scheduling, per i quali esistono diversi algoritmi esistenti che risolvono in modo davvero efficiente, ovviando alla necessità di investire nella reinvenzione.)

La qualità dei dati è la base. Fallo bene prima.

Soprattutto, quando stai pensando di investire nella scienza dei dati, e ancor più in ML e/o AI, è imperativo riconoscere che la base per qualsiasi potenziale risultato positivo è la qualità dei dati che hai a disposizione per il tuo team e suoi modelli o strumenti. Spazzatura dentro, spazzatura fuori, come si suol dire.

Un team di dottorandi potrebbe sviluppare per te un sistema di riconoscimento delle immagini di apprendimento automatico che superi anche quello che i grandi cannoni odierni hanno in atto. Ma se lo addestri con sette immagini di cani etichettati come gatti, l'unica cosa che farà è fallire in modo spettacolare.

La qualità, ovviamente, si estende più in profondità e qualsiasi scienziato di dati o ingegnere di dati degno di questo nome richiederà che tu ti concentri prima qui. Mentre lo fai, accuratezza, precisione, ricordo, tempestività e provenienza sono tutte considerazioni importanti, ma ciò che spesso viene pagato poco più di un semplice avvertimento è definire ciò che costituisce la qualità nel tuo particolare contesto. Proprio come le metriche di vanità che le aziende amano trottare (pensa "30 milioni di persone hanno scaricato la mia app", che non ti dice nulla su quanti di loro la stanno effettivamente utilizzando), se non consideri adeguatamente cosa costituisce la qualità, hai vinto non raggiungerlo.

Si consideri un set di dati che riguarda la presenza di bambini in una famiglia e la loro età. Se vendi tutine per neonati a genitori con neonati, la tempestività e la precisione sono fondamentali. Il tuo mercato di riferimento è stretto e, se sei in ritardo di qualche settimana, hai mancato il bersaglio. Tuttavia, se vendi giochi da tavolo per famiglie, potrebbe non avere importanza se sei fuori di un paio d'anni se la tua precisione è buona. Sono gli stessi dati, ma una diversa valutazione della qualità.

AI e ML saranno una parte fondamentale del nostro futuro. Non sto affermando che le aziende di oggi non dovrebbero impiegare data scientist di prim'ordine. Sto semplicemente dicendo che i leader dell'azienda devono assicurarsi di assumere in base a una strategia e a un'esigenza ben definiti e assicurarsi di disporre di dati puliti, di buona provenienza (ed eticamente) che siano sufficientemente sostanziali da giustificare una modellazione significativa al di sopra di essi. Concentrandoti in questo modo, puoi assicurarti che le risorse della tua organizzazione, così come il tempo e il talento dei tuoi data scientist, vengano sfruttate al meglio.