Es hora de una verificación de la realidad de AI/ML

Publicado: 2020-06-29

Rohan Chandran es el director de productos de Infogroup.

La ciencia de datos está experimentando su momento en el centro de atención, con esta disciplina vital sentando las bases para los nuevos avances de inteligencia artificial (IA) y aprendizaje automático (ML) a diario. Como seres humanos y líderes empresariales, nuestro apetito por lo último y lo mejor siempre es fuerte, y en este caso no es una excepción. En la actualidad, todos buscan aumentar sus prácticas de ciencia de datos y señalar el uso de IA y ML en sus productos y servicios.

Estamos exagerando. Estamos sobrediseñando soluciones. Estamos contratando personas para trabajos que resultan no ser tan publicitados y luego disolviendo equipos un año después, o preguntándonos por qué no están comprometidos y, naturalmente, se desgastan. Al hacerlo, también estamos impulsando un ecosistema que alienta a las personas a mejorar sus credenciales y buscar trabajos de ciencia de datos para los que no están realmente calificados, lo que dificulta que los empleadores genuinos contraten al talento adecuado. Las falsas economías no se sostienen.

Sin embargo, permítanme ser claro: la ciencia de datos es un campo esencial e incluso revolucionario en el panorama empresarial moderno. Las nuevas técnicas que se están desarrollando para comprender y hacer operativos los datos, cada vez más de forma automatizada, son transformadoras. La forma en que funcionamos está cambiando y debe seguir haciéndolo. Dicho esto, en nuestro absoluto deseo de ser parte de la historia de AI y ML, nos estamos ahogando en la ineficiencia. Permítanme explicar.

Los problemas simples se benefician con mayor frecuencia de las soluciones simples

YouTube está repleto de videos de máquinas complejas de Rube Goldberg. (Si no los ha visto, se los recomiendo: ¡horas de diversión mientras se refugia en el lugar!) Por muy notables que sean estos dispositivos, son, por definición, una solución innecesariamente compleja para un problema simple. Este enfoque se vuelve peligroso cuando lo traducimos al mundo de los negocios comenzando con una elección tecnológica ("¡Asegurémonos de que nuestros productos usen IA!") en lugar de comenzar con el problema comercial.

Como ejemplo, considere mi Toyota de 14 años. Tengo un llavero que se encuentra en mi bolsillo. Incluso si tengo una bolsa en cada mano, puedo acercarme al auto y simplemente abrir la puerta. No requiere esfuerzo adicional.

Luego llegaron los teléfonos con comunicación de campo cercano (NFC) incorporada. De repente, los fabricantes de automóviles se apresuraron a mostrar cómo se podía usar el teléfono con NFC para abrir la puerta del automóvil. Para hacerlo, simplemente tenía que sacar el teléfono de su bolsillo, acercarlo a la etiqueta NFC en la ventana y luego abrir la puerta.

Este ejemplo marca todas las casillas para los fabricantes de automóviles encargados de utilizar las últimas tecnologías. Permite que un ejecutivo suba al escenario y hable sobre cómo puede usar su teléfono para desbloquear su automóvil. Pero ahora, tengo que detenerme en mi auto, dejar mis bolsas de compras, sacar mi teléfono, sostenerlo, volver a guardarlo en mi bolsillo, recoger las bolsas y luego subirme al auto. Mi experiencia elegante y perfecta acaba de estar plagada de puntos débiles.

Desafortunadamente, esto es lo que hacen demasiadas personas cuando intentan desarrollar modelos complejos o crear una solución de IA para realizar tareas que tienen soluciones simples disponibles. Hacerlo por el simple hecho de hacerlo es un desperdicio de recursos y un detrimento económico a largo plazo. Las organizaciones más inteligentes muestran moderación y reconocen que las mejores soluciones a menudo surgen en el contexto de recursos escasos e incentivos que se alinean con la resolución de valor para el cliente y el negocio, en lugar de casillas de verificación tecnológicas.

Costo de oportunidad: si no está roto, no lo arregles.

El ejemplo del llavero también sirve para ilustrar la vieja perogrullada de no centrar el esfuerzo en los problemas resueltos. Si está tratando de administrar un negocio de manera eficiente, entonces desea concentrarse estrictamente en el valor agregado distintivo que brinda. Donde los problemas han sido resueltos por otros, y seamos sinceros, la mayoría de nuestros problemas no son tan únicos como queremos creer, aproveche su trabajo. Pararse en los hombros de los gigantes.

En lugar de crear un equipo de científicos de datos para resolver todo internamente, primero explore la disponibilidad de soluciones de código abierto o con licencia en otros lugares. A medida que la IA y el aprendizaje automático maduran como disciplinas, descubrimos que muchos de los jugadores más importantes en este espacio, incluidos Amazon, Google y otros, ya han invertido mucho en la creación de algoritmos y herramientas sólidos que se pueden emplear o adaptar fácilmente para resolver cualquier problema. número de desafíos de datos. No se gana nada empleando su propio equipo de 50 científicos de datos para resolver un problema que se puede abordar fácilmente con una solución lista para usar. (Para lectores con mentalidad técnica, hay un artículo interesante de Thomas Nield que explica un ejemplo específico de sistemas de programación, para los cuales existen varios algoritmos existentes que resuelven de manera muy eficiente, obviando la necesidad de invertir en reinvención).

La calidad de los datos es la base. Haz eso bien primero.

Sobre todo, cuando esté considerando invertir en ciencia de datos, y más aún en ML y/o IA, es imperativo que reconozca que la base para cualquier posible resultado exitoso es la calidad de los datos que tiene disponibles para su equipo y sus modelos o herramientas. Basura entra, basura sale, como dice el refrán.

Un equipo de doctores bien puede desarrollar un sistema de reconocimiento de imágenes de aprendizaje automático para usted que supera incluso lo que tienen las grandes armas hoy en día. Pero si lo entrenas con siete imágenes de perros etiquetados como gatos, lo único que hará será fallar espectacularmente.

La calidad, por supuesto, se extiende más allá de eso, y cualquier científico de datos o ingeniero de datos que se precie exigirá que se concentre aquí primero. Mientras lo hace, la exactitud, la precisión, el recuerdo, la puntualidad y la procedencia son todas consideraciones importantes, pero lo que a menudo se paga poco más que de boquilla es definir lo que constituye la calidad en su contexto particular. Al igual que las métricas de vanidad que a las empresas les encanta sacar a relucir (piense en "30 millones de personas descargaron mi aplicación", lo que no dice nada sobre cuántos de ellos realmente la están usando), si no considera adecuadamente lo que constituye la calidad, ganó no lograrlo.

Considere un conjunto de datos sobre la presencia de niños en un hogar y sus edades. Si está vendiendo mamelucos para bebés a padres con recién nacidos, entonces la puntualidad y la precisión son fundamentales. Su mercado objetivo es ajustado, y si se retrasa unas semanas, no ha dado en el blanco. Sin embargo, si está vendiendo juegos de mesa familiares, puede que apenas importe si tiene un par de años de diferencia si su precisión es buena. Son los mismos datos, pero una evaluación de calidad diferente.

AI y ML van a ser una parte fundamental de nuestro futuro. No estoy afirmando que las empresas de hoy en día no deberían emplear a los mejores científicos de datos de su clase. Simplemente estoy diciendo que los líderes de la empresa deben asegurarse de que están contratando en función de una estrategia y una necesidad bien definidas, y asegurarse de que tienen datos limpios, bien (y éticos) que son lo suficientemente sustantivos como para garantizar un modelo significativo encima. Al enfocarse de esta manera, puede asegurarse de que los recursos de su organización, así como el tiempo y el talento de sus científicos de datos, se aprovechen bien.