AI/ML 현실 확인이 필요한 때입니다.

게시 됨: 2020-06-29

Rohan Chandran은 Infogroup의 최고 제품 책임자입니다.

데이터 과학은 새로운 인공 지능(AI) 및 기계 학습(ML) 발전을 위한 토대를 마련하는 이 중요한 분야와 함께 각광을 받는 순간을 경험하고 있습니다. 인간으로서, 그리고 비즈니스 리더로서 우리의 최신 및 최고에 대한 욕구는 항상 강하며 이 경우에도 예외는 아닙니다. 현재 모든 사람들은 데이터 과학 관행을 강화하고 제품 및 서비스에서 AI 및 ML 사용을 지적하려고 합니다.

우리는 그것을 과도하게 사용하고 있습니다. 우리는 과잉 엔지니어링 솔루션입니다. 우리는 광고만큼 좋지 않은 것으로 밝혀진 다음 1년 후에 팀을 해산하거나 왜 그들이 약혼하지 않고 자연스럽게 퇴사하는지 궁금해하는 직업을 위해 사람들을 고용하고 있습니다. 그렇게 함으로써 우리는 또한 사람들이 자격 증명을 과장하고 실제로 자격이 없는 데이터 과학 직업을 찾도록 장려하는 생태계에 연료를 공급하고 있어 진정한 고용주가 적합한 인재를 고용하기 어렵게 만듭니다. 거짓 경제는 지속되지 않습니다.

하지만 분명히 말씀드리겠습니다. 데이터 과학은 현대 비즈니스 환경에서 필수적이고 심지어는 혁명적인 분야입니다. 점점 더 자동화된 방식으로 데이터를 이해하고 운영하기 위해 개발 중인 새로운 기술은 혁신적입니다. 우리가 기능하는 방식은 변화하고 있으며 계속 그렇게 해야 합니다. 하지만 AI 및 ML 이야기의 일부가 되고자 하는 절대적인 열망으로 인해 우리는 비효율성에 빠져들고 있습니다. 설명을 드리겠습니다.

간단한 문제는 가장 자주 간단한 솔루션의 이점을 얻습니다

YouTube는 복잡한 Rube Goldberg 기계의 비디오로 가득합니다. (아직 보지 못했다면 몇 시간 동안 대피하는 것을 강력히 추천합니다!) 이러한 장치가 놀랍긴 하지만 정의상 단순한 문제에 대한 불필요하게 복잡한 솔루션입니다. 이 접근 방식은 비즈니스 문제로 시작하기보다 기술 선택("우리 제품이 AI를 사용하도록 합시다!")으로 시작하여 비즈니스 세계로 번역할 때 위험해집니다.

예를 들어 제 14살 된 Toyota를 생각해 보십시오. 내 주머니에 열쇠 고리가 있습니다. 양 손에 가방을 들고 있어도 차까지 걸어가서 그냥 문을 열 수 있어요. 추가 노력이 필요하지 않습니다.

그런 다음 NFC(근거리 통신)가 내장된 전화기가 등장했습니다. 갑자기 자동차 제조업체가 NFC 지원 전화기를 사용하여 차 문을 여는 방법을 선보이기 위해 서두르고 있었습니다. 그렇게 하려면 주머니에서 전화기를 꺼내 창의 NFC 태그에 대고 문을 당겨서 열면 됩니다.

이 예에서는 최신 기술을 사용하는 자동차 제조업체의 모든 확인란을 선택합니다. 이를 통해 경영진이 무대에 올라 휴대폰을 사용하여 차의 잠금을 해제하는 방법에 대해 이야기할 수 있습니다. 하지만 이제는 차에 멈춰서 식료품 가방을 내려놓고 휴대폰을 꺼내 들고 다시 주머니에 넣고 가방을 들고 차에 타야 합니다. 내 우아하고 매끄러운 경험은 고통 포인트로 가득 차 있습니다.

이것은 불행히도 너무 많은 사람들이 사용 가능한 간단한 솔루션이 있는 작업을 수행하기 위해 복잡한 모델을 개발하거나 AI 솔루션을 구축하려고 할 때 하는 일입니다. 단지 그것을 위해 그렇게 하는 것은 자원 낭비이자 장기적인 경제적 손실입니다. 가장 현명한 조직은 자제력을 보이며 기술적인 체크박스가 아니라 고객 및 비즈니스 가치를 해결하는 것과 일치하는 희소한 자원과 인센티브의 맥락에서 최상의 솔루션이 종종 발생한다는 것을 인식합니다.

기회 비용: 고장나지 않았다면 고치지 마십시오.

열쇠 고리의 예는 또한 해결된 문제에 노력을 집중하지 않는 것에 대한 오래된 자명함을 설명하는 역할을 합니다. 비즈니스를 효율적으로 운영하려는 경우 제공하는 고유한 부가 가치에 집중해야 합니다. 문제가 다른 사람들에 의해 해결된 경우(사실을 직시하자면, 대부분의 문제는 우리가 믿고 싶은 만큼 고유하지 않은 경우) 그들의 작업을 활용합니다. 거인의 어깨 위에 서십시오.

사내에서 모든 것을 해결하기 위해 데이터 과학자 팀을 구성하는 대신 먼저 다른 곳에서 오픈 소스 또는 라이선스 가능한 솔루션의 가용성을 탐색하십시오. AI와 기계 학습이 학문 분야로 성숙해감에 따라 Amazon, Google 등을 비롯한 이 분야에서 가장 큰 기업 중 다수가 이미 모든 문제를 해결하기 위해 쉽게 사용하거나 조정할 수 있는 강력한 알고리즘과 도구를 만드는 데 막대한 투자를 하고 있다는 사실을 알게 되었습니다. 데이터 챌린지 수. 기성 솔루션으로 쉽게 해결할 수 있는 문제를 해결하기 위해 50명의 데이터 과학자로 구성된 자체 팀을 고용한다고 해서 얻을 수 있는 것은 없습니다. (기술적인 생각을 가진 독자를 위해 Thomas Nield의 흥미로운 기사에서 스케줄링 시스템의 특정 예를 안내합니다. 여기에는 재창조에 투자할 필요가 없어 매우 효율적으로 해결하는 기존 알고리즘이 몇 가지 있습니다.)

데이터 품질이 기초입니다. 그 권리를 먼저 얻으십시오.

무엇보다도 데이터 과학에 대한 투자, 그리고 ML 및/또는 AI에 대한 투자를 고려할 때 잠재적인 성공적인 결과의 기초는 팀에 사용할 수 있는 데이터의 품질과 그 모델이나 도구. 쓰레기는 들어가고 쓰레기는 나간다는 말이 있듯이.

박사 팀은 오늘날의 큰 총력을 능가하는 기계 학습 이미지 인식 시스템을 개발할 수 있습니다. 그러나 고양이로 분류된 7개의 개 사진으로 훈련하면 눈에 띄게 실패하는 것뿐입니다.

물론 품질은 그 이상으로 확장되며 가치가 있는 데이터 과학자나 데이터 엔지니어는 여기에 먼저 집중해야 합니다. 그렇게 할 때 정확성, 정확성, 재현율, 적시성 및 출처가 모두 중요한 고려 사항이지만 종종 립 서비스보다 약간 더 지불되는 것은 특정 상황에서 품질을 구성하는 요소를 정의하는 것입니다. 기업이 자랑스럽게 내세우는 허영심 지표(“3천만 명이 내 앱을 다운로드했다”고 생각해 보세요. 실제로 얼마나 많은 사람들이 앱을 사용하고 있는지 알려주지 않음)와 마찬가지로 품질을 구성하는 요소를 제대로 고려하지 않으면 승리하게 됩니다. 달성하지 마십시오.

가정 내 어린이의 존재 및 연령과 관련된 데이터 세트를 고려하십시오. 신생아가 있는 부모에게 유아용 속옷을 판매하는 경우 적시성과 정확성이 매우 중요합니다. 목표 시장은 좁고 몇 주 늦으면 목표를 놓친 것입니다. 그러나 가족 보드 게임을 판매하는 경우 정확도가 좋으면 몇 년 뒤쳐져도 거의 문제가 되지 않을 수 있습니다. 동일한 데이터이지만 다른 품질 평가입니다.

AI와 ML은 우리 미래의 근본적인 부분이 될 것입니다. 나는 오늘날의 기업이 동급 최고의 데이터 과학자를 고용해서는 안 된다고 주장하는 것이 아닙니다. 나는 단순히 회사 리더가 잘 정의된 전략과 요구 사항에 따라 고용하고 있는지 확인하고, 그 위에 중요한 모델링을 보증할 만큼 충분히 실질적인 깨끗하고 잘(그리고 윤리적으로) 소싱된 데이터를 보유하고 있는지 확인해야 한다고 말합니다. 이러한 방식으로 집중함으로써 조직의 리소스와 데이터 과학자의 시간과 재능이 제대로 활용되고 있는지 확인할 수 있습니다.