Пришло время проверить реальность AI/ML

Опубликовано: 2020-06-29

Рохан Чандран — директор по продукту в Infogroup.

Наука о данных переживает свой момент в центре внимания, и эта жизненно важная дисциплина ежедневно закладывает основу для нового искусственного интеллекта (ИИ) и машинного обучения (МО). Как люди и как бизнес-лидеры, наш аппетит к новейшему и лучшему всегда силен, и в данном случае это не исключение. В настоящее время все стремятся расширить свою практику обработки данных и указать на использование ИИ и машинного обучения в своих продуктах и услугах.

Мы переусердствуем. Мы чрезмерно инженерные решения. Мы нанимаем людей на работу, которая оказывается не совсем такой, как рекламируется, а затем либо распускаем команды год спустя, либо удивляемся, почему они не заняты и, естественно, истощаются. Поступая таким образом, мы также подпитываем экосистему, которая побуждает людей преувеличивать свои полномочия и искать работу в области обработки и обработки данных, для которой они не обладают достаточной квалификацией, из-за чего настоящим работодателям становится все труднее нанимать подходящих специалистов. Ложная экономия не выдерживает.

Однако позвольте мне прояснить: наука о данных — важная и даже революционная область в современном бизнес-ландшафте. Новые методы, разрабатываемые для понимания и операционализации данных, все чаще в автоматизированном режиме, носят преобразующий характер. То, как мы функционируем, меняется, и это должно продолжаться. Тем не менее, в нашем абсолютном желании стать частью истории ИИ и МО мы тонем в неэффективности. Позвольте мне объяснить.

Простые проблемы чаще всего выигрывают от простых решений

YouTube изобилует видеороликами о сложных машинах Руба Голдберга. (Если вы их еще не видели, я настоятельно рекомендую — часы веселья в укрытии на месте!) Какими бы замечательными ни были эти устройства, они по определению представляют собой излишне сложное решение простой проблемы. Этот подход становится опасным, когда мы переносим его в деловой мир, начиная с выбора технологии («Давайте убедимся, что в наших продуктах используется ИИ!»), а не с бизнес-проблемы.

В качестве примера рассмотрим мою 14-летнюю Тойоту. У меня есть брелок, который лежит в кармане. Даже если у меня в каждой руке по сумке, я могу подойти к машине и просто открыть дверь. Никаких дополнительных усилий не требуется.

Затем появились телефоны со встроенной связью ближнего радиуса действия (NFC). Внезапно производители автомобилей поспешили продемонстрировать, как вы можете использовать свой телефон с поддержкой NFC, чтобы открыть дверь автомобиля. Для этого вам просто нужно было вынуть телефон из кармана, поднести его к метке NFC на окне, а затем открыть дверь.

Этот пример отвечает всем требованиям производителей автомобилей, перед которыми стоит задача использования новейших технологий. Это позволяет руководителю подняться на сцену и рассказать о том, как вы можете использовать свой телефон, чтобы разблокировать свой автомобиль. Но теперь я должен остановиться у своей машины, положить сумки с продуктами, достать телефон, поднять его, положить обратно в карман, забрать сумки, а затем сесть в машину. Мой элегантный и цельный опыт только что стал пронизан болевыми точками.

К сожалению, это то, что делает слишком много людей, когда они пытаются разработать сложные модели или создать решение ИИ для выполнения задач, для которых доступны простые решения. Делать это только ради этого — пустая трата ресурсов и долгосрочный экономический ущерб. Самые сообразительные организации проявляют сдержанность и признают, что наилучшие решения часто возникают в условиях дефицита ресурсов и стимулов, которые связаны с поиском ценности для клиентов и бизнеса, а не с технологическими флажками.

Альтернативная стоимость: если это не сломано, не чините это.

Пример с брелоком также иллюстрирует старую истину о том, что не следует сосредотачивать усилия на решенных проблемах. Если вы пытаетесь эффективно управлять бизнесом, то вы должны быть сильно сосредоточены на особой добавленной стоимости, которую вы предоставляете. Там, где проблемы были решены другими — а давайте смотреть правде в глаза, большинство наших проблем не так уникальны, как нам хотелось бы верить, — используйте их работу. Встаньте на плечи гигантов.

Вместо того, чтобы создавать команду специалистов по обработке и анализу данных для решения всех задач внутри компании, сначала изучите доступные решения с открытым исходным кодом или лицензируемые в других местах. По мере того как ИИ и машинное обучение развиваются как дисциплины, мы обнаруживаем, что многие из крупнейших игроков в этой области, включая Amazon, Google и других, уже вложили значительные средства в создание надежных алгоритмов и инструментов, которые можно легко использовать или адаптировать для решения любых задач. количество проблем с данными. Нет ничего хорошего в том, чтобы нанять собственную команду из 50 специалистов по обработке и анализу данных для решения проблемы, которую можно легко решить с помощью готового решения. (Для читателей с техническим складом ума есть интересная статья Томаса Нилда, в которой рассматривается конкретный пример систем планирования, для которых существует несколько существующих алгоритмов, которые действительно эффективно решают задачи, избавляя от необходимости инвестировать в повторное изобретение.)

Качество данных — основа. Получите это правильно в первую очередь.

Прежде всего, когда вы рассматриваете возможность инвестирования в науку о данных и, особенно, в машинное обучение и/или искусственный интеллект, крайне важно, чтобы вы осознали, что основой любого потенциально успешного результата является качество данных, которые у вас есть для вашей команды и его модели или инструменты. Мусор на входе, мусор на выходе, как говорится.

Команда докторов наук вполне может разработать для вас систему распознавания изображений с машинным обучением, которая превзойдет даже то, что сегодня есть у больших пушек. Но если вы тренируете его с помощью семи изображений собак, помеченных как кошки, единственное, что он сделает, — это эффектно потерпит неудачу.

Качество, конечно, простирается глубже, и любой специалист по данным или инженер данных, достойный их соли, потребует, чтобы вы сначала сосредоточились на этом. При этом точность, четкость, отзыв, своевременность и происхождение являются важными факторами, но то, что часто оплачивается немногим больше, чем пустые слова, определяет, что представляет собой качество в вашем конкретном контексте. Подобно тщеславным метрикам, которые компании любят выставлять напоказ (представьте, что «30 миллионов человек скачали мое приложение», что ничего не говорит вам о том, сколько из них на самом деле используют его), если вы не поймете, что представляет собой качество, вы выиграете. не достичь этого.

Рассмотрим набор данных о наличии детей в домохозяйстве и их возрасте. Если вы продаете детские комбинезоны родителям новорожденных, своевременность и точность имеют решающее значение. Ваш целевой рынок ограничен, и если вы опоздали на несколько недель, вы промахнулись. Однако, если вы продаете семейные настольные игры, может не иметь большого значения, если вы ошибаетесь на пару лет, если ваша точность хороша. Это те же данные, но другая оценка качества.

AI и ML станут фундаментальной частью нашего будущего. Я не утверждаю, что сегодняшним предприятиям не следует нанимать лучших специалистов по данным. Я просто говорю, что лидеры компаний должны убедиться, что они нанимают в соответствии с четко определенной стратегией и потребностями, а также убедиться, что у них есть чистые, хорошо (и этично) полученные данные, которые являются достаточно существенными, чтобы гарантировать серьезное моделирование на их основе. Сосредоточившись таким образом, вы можете быть уверены, что ресурсы вашей организации, а также время и таланты ваших специалистов по обработке и анализу данных используются с пользой.