Este timpul pentru o verificare a realității AI/ML

Publicat: 2020-06-29

Rohan Chandran este Chief Product Officer la Infogroup.

Știința datelor își trăiește momentul în lumina reflectoarelor, această disciplină vitală punând bazele pentru noi progrese zilnice ale inteligenței artificiale (AI) și ale învățării automate (ML). Ca oameni și ca lideri de afaceri, apetitul nostru pentru cele mai noi și mai bune este întotdeauna puternică și nu face excepție în acest caz. În prezent, toată lumea caută să-și intensifice practicile de știință a datelor și să pună în evidență utilizarea AI și ML în produsele și serviciile lor.

Exagerăm. Exagerăm soluții. Angajăm oameni pentru locuri de muncă care se dovedesc a nu fi chiar așa cum s-a anunțat și apoi fie desființăm echipe un an mai târziu, fie ne întrebăm de ce nu sunt implicați și sunt în mod natural urâți. Făcând acest lucru, alimentăm, de asemenea, un ecosistem care încurajează oamenii să-și dezvolte acreditările și să caute locuri de muncă în domeniul științei datelor pentru care nu sunt cu adevărat calificați, ceea ce îngreunează angajatorilor adevărați să angajeze talentul potrivit. Economiile false nu se susțin.

Permiteți-mi să fiu clar însă: știința datelor este un domeniu esențial și chiar revoluționar în peisajul afacerilor moderne. Noile tehnici dezvoltate pentru înțelegerea și operaționalizarea datelor, din ce în ce mai mult într-un mod automatizat, sunt transformative. Modul în care funcționăm se schimbă și trebuie să o facem în continuare. Acestea fiind spuse, în dorința noastră absolută de a face parte din povestea AI și ML, ne înecăm în ineficiență. Dați-mi voie să vă explic.

Probleme simple Cel mai adesea beneficiază de soluții simple

YouTube este plin de videoclipuri cu mașini complexe Rube Goldberg. (Dacă nu le-ați văzut, vă recomand cu căldură—ore de distracție în timp ce vă adăpostiți în loc!) Oricât de remarcabile sunt aceste dispozitive, sunt, prin definiție, o soluție inutil de complexă pentru o problemă simplă. Această abordare devine periculoasă atunci când o traducem în lumea afacerilor, pornind de la o alegere tehnologică („Să ne asigurăm că produsele noastre folosesc AI!”), mai degrabă decât să începem cu problema afacerii.

Ca exemplu, luați în considerare Toyota-ul meu de 14 ani. Am un breloc care sta în buzunar. Chiar dacă am câte o geantă în fiecare mână, pot merge până la mașină și pur și simplu deschid ușa. Nu este necesar un efort suplimentar.

Apoi au apărut telefoanele cu comunicare în câmp apropiat (NFC) încorporat. Dintr-o dată, producătorii auto s-au grăbit să arate cum ai putea folosi telefonul cu NFC pentru a deschide ușa mașinii. Pentru a face acest lucru, trebuia pur și simplu să scoți telefonul din buzunar, să-l ții de eticheta NFC de pe fereastră și apoi să deschizi ușa.

Acest exemplu bifează toate casetele pentru producătorii de automobile însărcinați cu utilizarea celor mai noi tehnologii. Acesta permite unui director să urce pe scenă și să vorbească despre cum vă puteți folosi telefonul pentru a vă debloca mașina. Dar acum, trebuie să mă opresc la mașină, să-mi las bagajele de cumpărături, să-mi scot telefonul, să-l țin sus, să-l pun înapoi în buzunar, să iau pungile și apoi să intru în mașină. Experiența mea elegantă și fără întreruperi tocmai a devenit plină de puncte dureroase.

Acest lucru este, din păcate, ceea ce fac prea mulți oameni atunci când încearcă să dezvolte modele complexe sau să construiască o soluție AI, pentru a îndeplini sarcini care au soluții simple disponibile. A face acest lucru doar de dragul ei este o risipă de resurse și un detriment economic pe termen lung. Cele mai inteligente organizații dau dovadă de reținere și recunosc că cele mai bune soluții apar adesea în contextul resurselor limitate și al stimulentelor care se aliniază cu soluționarea pentru client și valoarea afacerii, mai degrabă decât casetele de selectare tehnologice.

Costul de oportunitate: dacă nu este stricat, nu-l repara.

Exemplul de cheie servește și pentru a ilustra vechiul truism despre neconcentrarea efortului asupra problemelor rezolvate. Dacă încercați să conduceți o afacere eficient, atunci doriți să vă concentrați asupra valorii adăugate distincte pe care o oferiți. Acolo unde problemele au fost rezolvate de alții – și să recunoaștem, majoritatea problemelor noastre nu sunt atât de unice pe cât am dori să credem – folosește munca lor. Stați pe umerii giganților.

În loc să construiți o echipă de oameni de știință de date care să rezolve totul în interior, mai întâi explorați disponibilitatea soluțiilor cu sursă deschisă sau cu licență în altă parte. Pe măsură ce AI și învățarea automată se maturizează ca discipline, constatăm că mulți dintre cei mai mari jucători din acest spațiu, inclusiv Amazon, Google și alții, au investit deja masiv în crearea de algoritmi și instrumente robuste care pot fi utilizate sau adaptate cu ușurință pentru a rezolva orice probleme. numărul de provocări de date. Nu există nimic de câștigat prin angajarea propriei echipe de 50 de oameni de știință a datelor pentru a rezolva o problemă care poate fi rezolvată cu ușurință printr-o soluție disponibilă. (Pentru cititorii cu mentalitate tehnică, există un articol interesant al lui Thomas Nield care prezintă un exemplu specific de sisteme de planificare, pentru care există câțiva algoritmi existenți care rezolvă cu adevărat eficient, evitând nevoia de a investi în reinventare.)

Calitatea datelor este fundamentul. Faceți asta mai întâi.

Mai presus de toate, atunci când vă gândiți să investiți în știința datelor și mai mult în ML și/sau AI, este imperativ să recunoașteți că baza oricărui rezultat potențial de succes este calitatea datelor pe care le aveți la dispoziție pentru echipa dvs. modelele sau instrumentele sale. Gunoi intră, gunoi afară, după cum se spune.

O echipă de doctori ar putea dezvolta un sistem de recunoaștere a imaginii de învățare automată pentru dvs., care depășește chiar și ceea ce au pus la dispoziție armele mari de astăzi. Dar dacă îl antrenezi cu șapte poze cu câini care sunt etichetați drept pisici, singurul lucru pe care îl va face este să eșueze spectaculos.

Calitatea, desigur, se extinde mai mult decât atât, și orice om de știință de date sau inginer de date care merită să-și merite va cere să vă concentrați mai întâi aici. Pe măsură ce faceți acest lucru, acuratețea, precizia, reamintirea, actualitatea și proveniența sunt toate considerații importante, dar ceea ce este adesea plătit puțin mai mult decât slujire este definirea a ceea ce constituie calitatea în contextul dvs. particular. La fel ca valorile de vanitate pe care companiile iubesc să le scoată (gândiți-vă că „30 de milioane de oameni mi-au descărcat aplicația”, care nu vă spune nimic despre câți dintre ei o folosesc de fapt), dacă nu luați în considerare în mod corespunzător ce reprezintă calitatea, veți câștiga nu o atingi.

Luați în considerare un set de date care se referă la prezența copiilor într-o gospodărie și vârstele acestora. Dacă vindeți costume pentru copii părinților cu nou-născuți, atunci oportunitatea și precizia sunt esențiale. Piața dvs. țintă este strânsă și, dacă ați întârziat câteva săptămâni, ați ratat obiectivul. Cu toate acestea, dacă vindeți jocuri de societate pentru familie, abia ar mai conta dacă sunteți întrerupt de câțiva ani dacă acuratețea dvs. este bună. Sunt aceleași date, dar o evaluare diferită a calității.

AI și ML vor fi o parte fundamentală a viitorului nostru. Nu afirm că întreprinderile de astăzi nu ar trebui să angajeze cei mai buni oameni de știință ai datelor. Spun pur și simplu că liderii companiei trebuie să se asigure că angajează în raport cu o strategie și o nevoie bine definite și să se asigure că au date curate, bine (și din punct de vedere etic), care sunt suficient de substanțiale pentru a justifica modelarea semnificativă. Concentrându-vă în acest mod, vă puteți asigura că resursele organizației dvs., precum și timpul și talentul oamenilor de știință în domeniul datelor dvs., sunt folosite în mod adecvat.