ถึงเวลาสำหรับ AI/ML Reality Check

เผยแพร่แล้ว: 2020-06-29

Rohan Chandran เป็นประธานเจ้าหน้าที่ฝ่ายผลิตภัณฑ์ของ Infogroup

วิทยาศาสตร์ข้อมูลกำลังประสบกับช่วงเวลานี้ในไฟแก็ซ ด้วยระเบียบวินัยที่สำคัญนี้ซึ่งเป็นการวางรากฐานสำหรับปัญญาประดิษฐ์ (AI) และการเรียนรู้ของเครื่อง (ML) ที่ก้าวหน้าทุกวัน ในฐานะมนุษย์และในฐานะผู้นำทางธุรกิจ ความกระหายในสิ่งล่าสุดและยิ่งใหญ่ที่สุดของเรานั้นแข็งแกร่งอยู่เสมอ และในกรณีนี้ก็ไม่มีข้อยกเว้น ในปัจจุบัน ทุกคนต่างต้องการเพิ่มแนวปฏิบัติด้านวิทยาศาสตร์ข้อมูลและชี้ไปที่การใช้ AI และ ML ในผลิตภัณฑ์และบริการของตน

เราทำมากเกินไป เรากำลังแก้ปัญหาด้านวิศวกรรมมากเกินไป เรากำลังจ้างพนักงานสำหรับงานที่ดูเหมือนโฆษณาแล้วค่อยยุบทีมในปีต่อมา หรือสงสัยว่าทำไมพวกเขาถึงไม่มีส่วนร่วมและมีลักษณะนิสัยโดยธรรมชาติ ในการทำเช่นนั้น เรายังเติมเชื้อเพลิงให้ระบบนิเวศที่สนับสนุนให้ผู้คนเปิดเผยข้อมูลประจำตัวและหางานด้านวิทยาศาสตร์ข้อมูลซึ่งพวกเขาไม่มีคุณสมบัติจริงๆ ทำให้นายจ้างที่แท้จริงจ้างคนที่มีความสามารถได้ยากขึ้น เศรษฐกิจเท็จไม่ยั่งยืน

ให้ฉันอธิบายให้ชัดเจน: วิทยาศาสตร์ข้อมูลเป็นสาขาที่สำคัญและปฏิวัติวงการในแนวธุรกิจสมัยใหม่ เทคนิคใหม่ๆ ที่ได้รับการพัฒนาเพื่อทำความเข้าใจและดำเนินการข้อมูล ซึ่งเพิ่มมากขึ้นในรูปแบบอัตโนมัตินั้นสามารถเปลี่ยนแปลงได้ วิธีการทำงานของเรากำลังเปลี่ยนไป และต้องทำต่อไป ที่กล่าวว่าในความปรารถนาอย่างแท้จริงของเราที่จะเป็นส่วนหนึ่งของเรื่องราว AI และ ML เรากำลังจมอยู่ในความไร้ประสิทธิภาพ ให้ฉันอธิบาย

ปัญหาง่าย ๆ มักจะได้ประโยชน์จากวิธีแก้ปัญหาง่ายๆ

YouTube เต็มไปด้วยวิดีโอของเครื่อง Rube Goldberg ที่ซับซ้อน (ถ้าคุณยังไม่ได้ดู ฉันขอแนะนำเป็นอย่างยิ่ง—ใช้เวลาสนุกหลายชั่วโมงในขณะที่หลบอยู่ในที่!) อุปกรณ์เหล่านี้น่าทึ่งมาก ตามคำจำกัดความแล้ว—เป็นวิธีแก้ปัญหาที่ซับซ้อนโดยไม่จำเป็นสำหรับปัญหาง่ายๆ แนวทางนี้จะเป็นอันตรายเมื่อเราเปลี่ยนไปสู่โลกธุรกิจโดยเริ่มจากการเลือกเทคโนโลยี (“มาทำให้แน่ใจว่าผลิตภัณฑ์ของเราใช้ AI!”) แทนที่จะเริ่มต้นด้วยปัญหาทางธุรกิจ

ตัวอย่างเช่น ลองนึกถึงโตโยต้าอายุ 14 ปีของฉัน ฉันมีพวงกุญแจอยู่ในกระเป๋า ถึงฉันจะมีกระเป๋าติดมือทั้งสองข้างฉันก็เดินขึ้นรถและเปิดประตูได้ ไม่ต้องใช้ความพยายามเพิ่มเติม

จากนั้นโทรศัพท์ที่มีการสื่อสารระยะใกล้ (NFC) มาในตัว ทันใดนั้นผู้ผลิตรถยนต์ก็รีบแสดงวิธีที่คุณสามารถใช้โทรศัพท์ที่เปิดใช้งาน NFC เพื่อเปิดประตูรถของคุณ ในการทำเช่นนั้น คุณเพียงแค่นำโทรศัพท์ออกจากกระเป๋าเสื้อ ถือไว้ที่แท็ก NFC ที่หน้าต่าง จากนั้นเปิดประตูให้เปิดออก

ตัวอย่างนี้จะทำเครื่องหมายในช่องทั้งหมดสำหรับผู้ผลิตรถยนต์ที่ได้รับมอบหมายให้ใช้เทคโนโลยีล่าสุด ช่วยให้ผู้บริหารลุกขึ้นบนเวทีและพูดคุยเกี่ยวกับวิธีที่คุณสามารถใช้โทรศัพท์เพื่อปลดล็อกรถของคุณได้ แต่ตอนนี้ ฉันต้องหยุดที่รถ วางถุงของชำ หยิบโทรศัพท์ออกมา ยกขึ้น ใส่กลับเข้าไปในกระเป๋าเสื้อ หยิบกระเป๋า แล้วขึ้นรถ ประสบการณ์ที่หรูหราและราบรื่นของฉันเพิ่งจะเต็มไปด้วยจุดปวด

น่าเสียดายที่คนจำนวนมากเกินไปทำสิ่งนี้เมื่อพวกเขาพยายามพัฒนาแบบจำลองที่ซับซ้อน หรือสร้างโซลูชัน AI เพื่อทำงานที่มีวิธีแก้ปัญหาง่ายๆ การทำเช่นนี้เพียงเพื่อประโยชน์ของมันคือการสูญเสียทรัพยากรและความเสียหายทางเศรษฐกิจในระยะยาว องค์กรที่ฉลาดที่สุดมักแสดงการยับยั้งชั่งใจและตระหนักว่าวิธีแก้ปัญหาที่ดีที่สุดมักเกิดขึ้นในบริบทของทรัพยากรและสิ่งจูงใจที่หายากซึ่งสอดคล้องกับการแก้ปัญหาเพื่อลูกค้าและมูลค่าทางธุรกิจ แทนที่จะเป็นช่องทำเครื่องหมายทางเทคโนโลยี

ค่าเสียโอกาส: หากไม่เสียอย่าซ่อม

ตัวอย่างคีย์ fob ยังใช้เพื่อแสดงให้เห็นถึงความจริงแบบเก่าที่ไม่เน้นความพยายามในการแก้ปัญหา หากคุณกำลังพยายามดำเนินธุรกิจอย่างมีประสิทธิภาพ คุณต้องการเน้นย้ำถึงมูลค่าเพิ่มที่แตกต่างที่คุณให้ไว้ เมื่อปัญหาได้รับการแก้ไขโดยผู้อื่น—และมาเผชิญหน้ากัน ปัญหาส่วนใหญ่ของเราไม่ได้มีลักษณะเฉพาะอย่างที่เราอยากจะเชื่อ—ใช้ประโยชน์จากงานของพวกเขา ยืนบนไหล่ของยักษ์

แทนที่จะสร้างทีมนักวิทยาศาสตร์ข้อมูลเพื่อแก้ปัญหาทุกอย่างภายในองค์กร ก่อนอื่นให้สำรวจความพร้อมใช้งานของโซลูชันโอเพนซอร์ซหรือโซลูชันที่ได้รับอนุญาตในที่อื่น ในขณะที่ AI และแมชชีนเลิร์นนิงเติบโตขึ้นอย่างมีวินัย เราพบว่าผู้เล่นรายใหญ่ที่สุดหลายแห่งในพื้นที่นี้ รวมถึง Amazon, Google และอื่นๆ ได้ลงทุนอย่างหนักเพื่อสร้างอัลกอริธึมและเครื่องมือที่มีประสิทธิภาพซึ่งสามารถนำมาใช้หรือดัดแปลงเพื่อแก้ปัญหาใดๆ ได้อย่างง่ายดาย จำนวนความท้าทายของข้อมูล ไม่มีอะไรได้มาจากการจ้างทีมนักวิทยาศาสตร์ข้อมูล 50 คนของคุณเพื่อแก้ปัญหาที่สามารถแก้ไขได้โดยวิธีแก้ไขปัญหาที่หาซื้อได้ทั่วไป (สำหรับผู้อ่านที่มีความคิดเชิงเทคนิค มีบทความที่น่าสนใจโดย Thomas Nield ที่กล่าวถึงตัวอย่างเฉพาะของระบบการจัดกำหนดการ ซึ่งมีอัลกอริทึมที่มีอยู่หลายตัวที่แก้ปัญหาได้อย่างมีประสิทธิภาพอย่างแท้จริง โดยไม่จำเป็นต้องลงทุนในการประดิษฐ์ใหม่)

คุณภาพของข้อมูลคือรากฐาน รับสิทธิ์นั้นก่อน

เหนือสิ่งอื่นใด เมื่อคุณกำลังพิจารณาลงทุนในวิทยาศาสตร์ข้อมูล และอื่นๆ ใน ML และ/หรือ AI คุณจำเป็นต้องตระหนักว่ารากฐานสำหรับผลลัพธ์ที่ประสบความสำเร็จใดๆ ที่อาจเกิดขึ้นคือคุณภาพของข้อมูลที่คุณมีสำหรับทีมของคุณและ รุ่นหรือเครื่องมือของมัน ขยะเข้า ขยะออก ตามคำกล่าวที่ว่า

ทีมงานระดับปริญญาเอกอาจพัฒนาระบบการจดจำภาพการเรียนรู้ด้วยเครื่องสำหรับคุณซึ่งทำได้ดีกว่าที่ปืนใหญ่ในปัจจุบันมีอยู่ แต่ถ้าคุณฝึกมันด้วยภาพสุนัขเจ็ดรูปที่ระบุว่าเป็นแมว สิ่งเดียวที่มันจะทำคือล้มเหลวอย่างน่าทึ่ง

แน่นอนว่าคุณภาพนั้นมีอยู่ลึกกว่านั้น และนักวิทยาศาสตร์ข้อมูลหรือวิศวกรข้อมูลใดๆ ก็ตามที่คุ้มค่า พวกเขาต้องการให้คุณโฟกัสที่นี่ก่อน ในขณะที่คุณทำเช่นนั้น ความแม่นยำ ความแม่นยำ การเรียกคืน ความทันเวลา และที่มาล้วนเป็นข้อพิจารณาที่สำคัญทั้งหมด แต่สิ่งที่มักจะจ่ายน้อยกว่าบริการริมฝีปากนั้นเป็นตัวกำหนดสิ่งที่ก่อให้เกิดคุณภาพในบริบทเฉพาะของคุณ เช่นเดียวกับตัวชี้วัดที่ไร้สาระที่บริษัทต่างๆ ชอบที่จะใช้งาน (คิดว่า "30 ล้านคนดาวน์โหลดแอปของฉัน" ซึ่งไม่ได้บอกคุณว่ามีกี่คนที่ใช้งานแอปนี้จริง ๆ ) หากคุณไม่พิจารณาอย่างเหมาะสมว่าสิ่งใดคือคุณภาพ คุณจะชนะ ไม่บรรลุมัน

พิจารณาชุดข้อมูลที่เกี่ยวข้องกับการมีเด็กอยู่ในบ้านและอายุของพวกเขา หากคุณกำลังขายเด็กทารกให้กับพ่อแม่ที่มีทารกแรกเกิด ความตรงต่อเวลาและความแม่นยำเป็นสิ่งสำคัญ ตลาดเป้าหมายของคุณคับแคบ และหากคุณมาช้าไปสองสามสัปดาห์ แสดงว่าคุณพลาดเป้า อย่างไรก็ตาม หากคุณขายเกมกระดานสำหรับครอบครัว อาจแทบไม่สำคัญว่าคุณจะเลิกเล่นภายในสองสามปีหากความแม่นยำของคุณดี เป็นข้อมูลเดียวกัน แต่การประเมินคุณภาพต่างกัน

AI และ ML จะเป็นส่วนสำคัญในอนาคตของเรา ฉันไม่ได้ยืนยันว่าองค์กรในปัจจุบันไม่ควรจ้างนักวิทยาศาสตร์ข้อมูลที่ดีที่สุด ฉันแค่บอกว่าผู้นำของบริษัทจำเป็นต้องตรวจสอบให้แน่ใจว่าพวกเขากำลังจ้างงานโดยขัดกับกลยุทธ์และความต้องการที่กำหนดไว้อย่างชัดเจน และต้องแน่ใจว่าพวกเขามีแหล่งข้อมูลที่สะอาด ดี (และถูกต้องตามหลักจริยธรรม) ที่มีสาระสำคัญเพียงพอที่จะรับประกันการสร้างแบบจำลองที่สำคัญบนนั้น โดยเน้นในลักษณะนี้ คุณสามารถมั่นใจได้ว่าทรัพยากรขององค์กรของคุณ — เช่นเดียวกับเวลาและความสามารถของนักวิทยาศาสตร์ข้อมูลของคุณ — จะถูกนำไปใช้อย่างดี