É hora de uma verificação da realidade de IA/ML

Publicados: 2020-06-29

Rohan Chandran é o Chief Product Officer do Infogroup.

A ciência de dados está vivendo seu momento de destaque, com essa disciplina vital estabelecendo as bases para novos avanços em inteligência artificial (IA) e aprendizado de máquina (ML) diariamente. Como humanos e líderes de negócios, nosso apetite pelo melhor e mais recente é sempre forte, e não é exceção neste caso. Atualmente, todo mundo está procurando aumentar suas práticas de ciência de dados e apontar para o uso de IA e ML em seus produtos e serviços.

Estamos exagerando. Somos soluções de engenharia excessiva. Estamos contratando pessoas para trabalhos que acabam não sendo tão anunciados e, um ano depois, desmantelamos as equipes ou nos perguntamos por que elas não estão engajadas e estão naturalmente se desgastando. Ao fazer isso, também estamos alimentando um ecossistema que incentiva as pessoas a melhorarem suas credenciais e buscarem empregos em ciência de dados para os quais não são realmente qualificados, dificultando a contratação dos talentos certos por empregadores genuínos. Falsas economias não se sustentam.

Deixe-me ser claro: a ciência de dados é um campo essencial e até revolucionário no cenário empresarial moderno. As novas técnicas que estão sendo desenvolvidas para entender e operacionalizar dados, cada vez mais de forma automatizada, são transformadoras. A forma como funcionamos está mudando e deve continuar a mudar. Dito isso, em nosso desejo absoluto de fazer parte da história de IA e ML, estamos nos afogando em ineficiência. Permita-me explicar.

Problemas simples geralmente se beneficiam de soluções simples

O YouTube está repleto de vídeos de máquinas complexas de Rube Goldberg. (Se você ainda não os viu, eu recomendo – horas de diversão enquanto se protege no local!) Por mais notáveis que sejam esses dispositivos, eles são – por definição – uma solução desnecessariamente complexa para um problema simples. Essa abordagem se torna perigosa quando a traduzimos para o mundo dos negócios, começando com uma escolha de tecnologia (“Vamos garantir que nossos produtos usem IA!”) em vez de começar com o problema de negócios.

Como exemplo, considere meu Toyota de 14 anos. Eu tenho um chaveiro que fica no meu bolso. Mesmo que eu tenha uma sacola em cada mão, posso ir até o carro e simplesmente abrir a porta. Nenhum esforço extra necessário.

Em seguida, vieram os telefones com comunicação de campo próximo (NFC) integrada. De repente, os fabricantes de automóveis estavam correndo para mostrar como você poderia usar seu telefone habilitado para NFC para abrir a porta do carro. Para fazer isso, bastava tirar o telefone do bolso, segurá-lo na etiqueta NFC na janela e abrir a porta.

Este exemplo verifica todas as caixas para fabricantes de automóveis encarregados de usar as tecnologias mais recentes. Ele permite que um executivo suba no palco e fale sobre como você pode usar seu telefone para desbloquear seu carro. Mas agora, tenho que parar no meu carro, largar minhas sacolas de compras, pegar meu telefone, segurá-lo, colocá-lo de volta no bolso, pegar as sacolas e entrar no carro. Minha experiência elegante e perfeita acabou de se tornar repleta de pontos problemáticos.

Infelizmente, isso é o que muitas pessoas estão fazendo quando tentam desenvolver modelos complexos ou construir uma solução de IA para executar tarefas que têm soluções simples disponíveis. Fazer isso apenas por fazer é um desperdício de recursos e um prejuízo econômico de longo prazo. As organizações mais inteligentes mostram contenção e reconhecem que as melhores soluções geralmente surgem no contexto de recursos escassos e incentivos que se alinham com a solução para o valor do cliente e do negócio, em vez de caixas de seleção tecnológicas.

Custo de oportunidade: se não está quebrado, não conserte.

O exemplo chave fob também serve para ilustrar o velho truísmo sobre não concentrar esforços em problemas resolvidos. Se você está tentando administrar um negócio de forma eficiente, então você quer se concentrar no valor agregado distinto que você fornece. Onde os problemas foram resolvidos por outros - e vamos encarar, a maioria dos nossos problemas não são tão únicos quanto queremos acreditar - aproveite o trabalho deles. Fique de pé sobre os ombros dos gigantes.

Em vez de construir uma equipe de cientistas de dados para resolver tudo internamente, primeiro explore a disponibilidade de soluções de código aberto ou licenciáveis em outros lugares. À medida que a IA e o aprendizado de máquina amadurecem como disciplinas, descobrimos que muitos dos maiores players desse espaço – incluindo Amazon, Google e outros – já investiram pesadamente na criação de algoritmos e ferramentas robustos que podem ser facilmente empregados ou adaptados para resolver qualquer problema. número de desafios de dados. Não há nada a ganhar empregando sua própria equipe de 50 cientistas de dados para resolver um problema que pode ser prontamente resolvido por uma solução pronta para uso. (Para leitores com mentalidade técnica, há um artigo interessante de Thomas Nield que percorre um exemplo específico de sistemas de agendamento, para os quais existem vários algoritmos existentes que resolvem de maneira realmente eficiente, evitando a necessidade de investir em reinvenção.)

Qualidade de dados é a base. Acerte isso primeiro.

Acima de tudo, quando você está pensando em investir em ciência de dados, e mais ainda em ML e/ou IA, é imperativo que você reconheça que a base para qualquer resultado de sucesso potencial é a qualidade dos dados que você tem disponível para sua equipe e seus modelos ou ferramentas. Lixo dentro, lixo fora, como diz o ditado.

Uma equipe de PhDs pode desenvolver um sistema de reconhecimento de imagem de aprendizado de máquina para você que supera até mesmo o que as grandes armas de hoje têm. Mas se você treiná-lo com sete fotos de cães rotulados como gatos, a única coisa que ele fará é falhar espetacularmente.

A qualidade, é claro, vai além disso, e qualquer cientista de dados ou engenheiro de dados que se preze exigirá que você se concentre aqui primeiro. Ao fazê-lo, exatidão, precisão, recordação, pontualidade e procedência são considerações importantes, mas o que muitas vezes é pago pouco mais do que um palavrão é definir o que constitui qualidade em seu contexto específico. Muito parecido com as métricas de vaidade que as empresas adoram apresentar (pense em “30 milhões de pessoas baixaram meu aplicativo”, o que não diz nada sobre quantas delas estão realmente usando), se você não considerar adequadamente o que constitui qualidade, você ganhará não atingi-lo.

Considere um conjunto de dados que diz respeito à presença de crianças em uma casa e suas idades. Se você está vendendo macacões infantis para pais com recém-nascidos, a pontualidade e a precisão são essenciais. Seu mercado-alvo é apertado, e se você estiver algumas semanas atrasado, você perdeu o alvo. No entanto, se você estiver vendendo jogos de tabuleiro para a família, pouco importará se você perder alguns anos se sua precisão for boa. São os mesmos dados, mas uma avaliação de qualidade diferente.

AI e ML serão uma parte fundamental do nosso futuro. Não estou afirmando que as empresas de hoje não deveriam empregar os melhores cientistas de dados da categoria. Estou simplesmente dizendo que os líderes da empresa precisam garantir que estão contratando de acordo com uma estratégia e necessidade bem definidas, e garantir que tenham dados limpos, bem (e eticamente) de origem que sejam suficientemente substantivos para garantir uma modelagem significativa sobre eles. Ao se concentrar dessa maneira, você pode garantir que os recursos de sua organização — bem como o tempo e o talento de seus cientistas de dados — estejam sendo bem utilizados.