حان الوقت للتحقق من الواقع AI / ML
نشرت: 2020-06-29روهان تشاندران هو كبير مسؤولي المنتجات في Infogroup.
يمر علم البيانات بلحظاته في دائرة الضوء ، حيث يضع هذا النظام الحيوي الأساس لتقدم الذكاء الاصطناعي الجديد (AI) والتعلم الآلي (ML) على أساس يومي. بصفتنا بشرًا وكقادة أعمال ، فإن شهيتنا للأحدث والأفضل دائمًا قوية ، وليست استثناءً في هذه الحالة. في الوقت الحالي ، يتطلع الجميع إلى تكثيف ممارسات علم البيانات الخاصة بهم والإشارة إلى استخدام الذكاء الاصطناعي والتعلم الآلي في منتجاتهم وخدماتهم.
نحن نبالغ فيه. نحن نبالغ في هندسة الحلول. نحن نوظف أشخاصًا للوظائف التي تبين أنها ليست تمامًا كما هو معلن عنها ، ثم إما أن نقوم بحل الفرق بعد عام ، أو نتساءل عن سبب عدم مشاركتهم واستنزافهم بشكل طبيعي. من خلال القيام بذلك ، نحن أيضًا نغذي نظامًا بيئيًا يشجع الناس على إفساد أوراق اعتمادهم والبحث عن وظائف في علم البيانات ليسوا مؤهلين لها حقًا ، مما يجعل من الصعب على أصحاب العمل الحقيقيين توظيف المواهب المناسبة. الاقتصادات الكاذبة لا تستمر.
اسمحوا لي أن أكون واضحًا على الرغم من ذلك: علم البيانات هو مجال أساسي وحتى ثوري في مشهد الأعمال الحديث. تعتبر التقنيات الجديدة التي يتم تطويرها لفهم البيانات وتشغيلها ، بشكل متزايد بطريقة آلية ، تحويلية. الطريقة التي نعمل بها تتغير ، ويجب أن نستمر في القيام بذلك. ومع ذلك ، في رغبتنا المطلقة في أن نكون جزءًا من قصة الذكاء الاصطناعي والتعلم الآلي ، فإننا نغرق أنفسنا في عدم الكفاءة. اسمح لي أن أشرح.
غالبًا ما تستفيد المشكلات البسيطة من الحلول البسيطة
يزخر موقع YouTube بمقاطع فيديو لآلات Rube Goldberg المعقدة. (إذا لم تكن قد رأيتها ، فإنني أوصي بشدة - ساعات من المرح أثناء الاحتماء في مكانها!) على الرغم من كونها رائعة مثل هذه الأجهزة ، فهي - بحكم تعريفها - حل معقد بلا داع لمشكلة بسيطة. يصبح هذا النهج خطيرًا عندما نترجمه إلى عالم الأعمال بالبدء باختيار التكنولوجيا ("دعونا نتأكد من أن منتجاتنا تستخدم الذكاء الاصطناعي!") بدلاً من البدء بمشكلة العمل.
على سبيل المثال ، فكر في سيارة تويوتا البالغة من العمر 14 عامًا. لدي مفتاح فوب في جيبي. حتى لو كان لدي حقيبة في كل يد ، يمكنني السير إلى السيارة وفتح الباب. لا يتطلب مجهود إضافي.
ثم جاءت الهواتف المزودة بتقنية الاتصال قريب المدى (NFC). وفجأة ، سارعت شركات تصنيع السيارات لعرض كيف يمكنك استخدام هاتفك المزود بتقنية NFC لفتح باب سيارتك. للقيام بذلك ، كان عليك ببساطة إخراج الهاتف من جيبك ، وتثبيته على علامة NFC على النافذة ، ثم فتح الباب.
يتحقق هذا المثال من جميع المربعات لمصنعي السيارات المكلفين باستخدام أحدث التقنيات. يسمح للمسؤول التنفيذي بالوقوف على خشبة المسرح والتحدث عن كيفية استخدام هاتفك لإلغاء قفل سيارتك. لكن الآن ، يجب أن أتوقف عند سيارتي ، وأضع حقائب البقالة الخاصة بي ، وأخرج هاتفي ، وأضعه في جيبي ، وأعيده إلى جيبي ، وألتقط الحقائب ، ثم أركب السيارة. أصبحت تجربتي الأنيقة والسلسة مليئة بنقاط الألم.
هذا للأسف ما يفعله الكثير من الناس عندما يحاولون تطوير نماذج معقدة ، أو بناء حل للذكاء الاصطناعي ، لأداء مهام لها حلول بسيطة متاحة. إن القيام بذلك من أجله فقط هو إهدار للموارد وضرر اقتصادي طويل الأجل. تظهر المنظمات الأكثر ذكاءً ضبط النفس وتدرك أن أفضل الحلول تنشأ غالبًا في سياق الموارد النادرة والحوافز التي تتوافق مع حل قيمة العملاء والأعمال ، بدلاً من مربعات الاختيار التكنولوجية.
تكلفة الفرصة: إذا لم يتم كسرها ، فلا تقم بإصلاحها.
يعمل مثال فوب الرئيسي أيضًا على توضيح الحقيقة البديهية القديمة حول عدم تركيز الجهد على المشكلات التي تم حلها. إذا كنت تحاول إدارة نشاط تجاري بكفاءة ، فأنت تريد أن تركز بشدة على القيمة المضافة المميزة التي تقدمها. حيثما تم حل المشاكل من قبل الآخرين - ودعنا نواجه الأمر ، فإن معظم مشاكلنا ليست فريدة من نوعها كما قد نرغب في تصديقها - الاستفادة من عملهم. الوقوف على أكتاف العمالقة.
بدلاً من تكوين فريق من علماء البيانات لحل كل شيء داخليًا ، استكشف أولاً مدى توفر الحلول المفتوحة المصدر أو المرخصة في مكان آخر. مع نضوج الذكاء الاصطناعي والتعلم الآلي كتخصصات ، وجدنا أن العديد من أكبر اللاعبين في هذا المجال - بما في ذلك Amazon و Google وغيرهما - قد استثمروا بالفعل بشكل كبير في إنشاء خوارزميات وأدوات قوية يمكن توظيفها أو تكييفها بسهولة لحل أي عدد تحديات البيانات. لا يوجد شيء يمكن كسبه من خلال توظيف فريقك الخاص المكون من 50 عالم بيانات لحل مشكلة يمكن معالجتها بسهولة عن طريق حل جاهز للاستخدام. (للقراء المهتمين من الناحية الفنية ، هناك مقال مثير للاهتمام بقلم توماس نيلد يسير في مثال محدد لأنظمة الجدولة ، حيث توجد العديد من الخوارزميات الحالية التي تحل بالفعل بكفاءة ، وتجنب الحاجة إلى الاستثمار في إعادة الاختراع.)
جودة البيانات هي الأساس. احصل على هذا الحق أولاً.
قبل كل شيء ، عندما تفكر في الاستثمار في علم البيانات ، وأكثر من ذلك في ML و / أو AI ، من الضروري أن تدرك أن أساس أي نتيجة ناجحة محتملة هو جودة البيانات المتاحة لفريقك و نماذجها أو أدواتها. القمامة في الداخل ، والقمامة خارج ، كما يقول المثل.
قد يقوم فريق من حاملي الدكتوراه بتطوير نظام التعرف على الصور للتعلم الآلي من أجلك والذي يتفوق حتى على ما تمتلكه المدافع الكبيرة اليوم. ولكن إذا قمت بتدريبها بسبع صور لكلاب تم تصنيفها على أنها قطط ، فإن الشيء الوحيد الذي ستفعله هو أن تفشل بشكل مذهل.
تمتد الجودة ، بالطبع ، إلى أعمق من ذلك ، وسيطلب منك أي عالم بيانات أو مهندس بيانات يستحق كل هذا التركيز أن تركز هنا أولاً. أثناء قيامك بذلك ، فإن الدقة ، والدقة ، والتذكر ، وحسن التوقيت ، والمصدر كلها اعتبارات مهمة ، ولكن ما يتم دفعه في كثير من الأحيان أكثر بقليل من التشدق بالكلام هو تحديد ما يشكل الجودة في سياقك الخاص. تشبه إلى حد كبير مقاييس الغرور التي تحب الشركات نشرها (فكر في "30 مليون شخص نزّلوا تطبيقي" ، والذي لا يخبرك شيئًا عن عدد الأشخاص الذين يستخدمونه بالفعل) ، إذا لم تفكر بشكل صحيح في ما يشكل الجودة ، فستفوز ر.
ضع في اعتبارك مجموعة البيانات التي تتعلق بوجود الأطفال في الأسرة وأعمارهم. إذا كنت تبيع الأطفال الرضع للآباء والأمهات مع الأطفال حديثي الولادة ، فإن التوقيت والدقة أمران حاسمان. السوق المستهدف ضيق ، وإذا تأخرت بضعة أسابيع ، فقد فاتك الهدف. ومع ذلك ، إذا كنت تبيع ألعابًا لوحية عائلية ، فقد لا يهم إذا كنت ستتوقف عن العمل لمدة عامين إذا كانت دقتك جيدة. إنها نفس البيانات ، لكن تقييم جودة مختلف.
سيكون الذكاء الاصطناعي والتعلم الآلي جزءًا أساسيًا من مستقبلنا. أنا لا أؤكد أن مؤسسات اليوم لا ينبغي أن توظف أفضل علماء البيانات في فئتهم. أنا أقول ببساطة إن قادة الشركة بحاجة إلى التأكد من أنهم يقومون بالتوظيف وفقًا لإستراتيجية وحاجة محددة جيدًا ، والتأكد من حصولهم على بيانات نظيفة وجيدة (وأخلاقية) من مصادر موثوقة بما يكفي لضمان نمذجة كبيرة فوقها. من خلال التركيز بهذه الطريقة ، يمكنك التأكد من أن موارد مؤسستك - بالإضافة إلى وقت وموهبة علماء البيانات - يتم استخدامها بشكل جيد.