Es ist Zeit für einen KI/ML-Realitätscheck
Veröffentlicht: 2020-06-29Rohan Chandran ist Chief Product Officer bei Infogroup.
Die Datenwissenschaft erlebt ihren Moment im Rampenlicht, wobei diese wichtige Disziplin täglich die Grundlage für neue Fortschritte im Bereich der künstlichen Intelligenz (KI) und des maschinellen Lernens (ML) legt. Als Menschen und als Führungskräfte ist unser Appetit auf das Neueste und Beste immer groß, und das ist in diesem Fall keine Ausnahme. Derzeit versuchen alle, ihre Data-Science-Praktiken zu verbessern und auf die Verwendung von KI und ML in ihren Produkten und Dienstleistungen hinzuweisen.
Wir übertreiben es. Wir überarbeiten Lösungen. Wir stellen Leute für Jobs ein, die sich als nicht ganz so ausgeschrieben herausstellen, und lösen dann entweder Teams ein Jahr später auf oder fragen uns, warum sie nicht engagiert sind und natürlich abwandern. Auf diese Weise fördern wir auch ein Ökosystem, das Menschen dazu ermutigt, ihre Zeugnisse aufzupolieren und Jobs in der Datenwissenschaft zu suchen, für die sie nicht wirklich qualifiziert sind, was es für echte Arbeitgeber schwieriger macht, die richtigen Talente einzustellen. Falsche Ökonomien halten nicht aus.
Lassen Sie mich jedoch klarstellen: Data Science ist ein wesentliches und sogar revolutionäres Feld in der modernen Geschäftslandschaft. Die neuen Techniken, die entwickelt werden, um Daten zu verstehen und zunehmend automatisiert zu operationalisieren, sind transformativ. Die Art und Weise, wie wir funktionieren, ändert sich und muss dies auch weiterhin tun. Allerdings ertrinken wir in unserem unbedingten Wunsch, Teil der KI- und ML-Geschichte zu sein, in Ineffizienz. Lassen Sie mich erklären.
Einfache Probleme profitieren meistens von einfachen Lösungen
YouTube ist voll von Videos von komplexen Rube-Goldberg-Maschinen. (Wenn Sie sie noch nicht gesehen haben, empfehle ich Ihnen wärmstens – stundenlangen Spaß beim Schutz vor Ort!) So bemerkenswert diese Geräte auch sind, sie sind – per Definition – eine unnötig komplexe Lösung für ein einfaches Problem. Dieser Ansatz wird gefährlich, wenn wir ihn auf die Geschäftswelt übertragen, indem wir mit einer Technologieentscheidung beginnen („Lasst uns sicherstellen, dass unsere Produkte KI verwenden!“), anstatt mit dem Geschäftsproblem zu beginnen.
Betrachten Sie als Beispiel meinen 14 Jahre alten Toyota. Ich habe einen Schlüsselanhänger, der in meiner Tasche sitzt. Selbst wenn ich in jeder Hand eine Tasche habe, kann ich zum Auto gehen und einfach die Tür öffnen. Kein zusätzlicher Aufwand erforderlich.
Dann kamen Telefone mit eingebauter Nahfeldkommunikation (NFC). Plötzlich beeilten sich die Autohersteller, zu zeigen, wie Sie Ihr NFC-fähiges Telefon verwenden können, um Ihre Autotür zu öffnen. Dazu musste man das Telefon einfach aus der Tasche nehmen, an den NFC-Tag am Fenster halten und dann die Tür aufziehen.
Dieses Beispiel erfüllt alle Kriterien für Automobilhersteller, die die Aufgabe haben, die neuesten Technologien einzusetzen. Es ermöglicht einer Führungskraft, auf die Bühne zu treten und darüber zu sprechen, wie Sie Ihr Telefon verwenden können, um Ihr Auto zu entriegeln. Aber jetzt muss ich an meinem Auto anhalten, meine Einkaufstüten abstellen, mein Handy herausnehmen, es hochhalten, es wieder in meine Tasche stecken, die Tüten aufheben und dann ins Auto steigen. Meine elegante und nahtlose Erfahrung wurde gerade mit Schmerzpunkten durchsetzt.
Dies ist leider das, was zu viele Menschen tun, wenn sie versuchen, komplexe Modelle zu entwickeln oder eine KI-Lösung zu bauen, um Aufgaben auszuführen, für die einfache Lösungen verfügbar sind. Dies nur um der Sache willen zu tun, ist eine Verschwendung von Ressourcen und ein langfristiger wirtschaftlicher Nachteil. Die klügsten Unternehmen zeigen Zurückhaltung und erkennen, dass die besten Lösungen oft im Zusammenhang mit knappen Ressourcen und Anreizen entstehen, die sich eher an der Lösung für den Kunden- und Geschäftswert ausrichten als an technologischen Checkboxen.
Opportunitätskosten: Wenn es nicht kaputt ist, repariere es nicht.
Das Schlüsselanhänger-Beispiel dient auch dazu, die alte Binsenweisheit zu illustrieren, sich nicht auf gelöste Probleme zu konzentrieren. Wenn Sie versuchen, ein Unternehmen effizient zu führen, sollten Sie sich stark auf den eindeutigen Mehrwert konzentrieren, den Sie bieten. Wo Probleme von anderen gelöst wurden – und seien wir ehrlich, die meisten unserer Probleme sind nicht so einzigartig, wie wir vielleicht glauben möchten – nutzen Sie ihre Arbeit. Auf den Schultern von Giganten stehen.
Anstatt ein Team von Data Scientists aufzubauen, um alles intern zu lösen, erkunden Sie zuerst die Verfügbarkeit von Open-Source- oder lizenzierbaren Lösungen an anderer Stelle. Während KI und maschinelles Lernen als Disziplinen reifen, stellen wir fest, dass viele der größten Akteure in diesem Bereich – darunter Amazon, Google und andere – bereits viel in die Entwicklung robuster Algorithmen und Tools investiert haben, die einfach eingesetzt oder angepasst werden können, um Probleme zu lösen Reihe von Datenherausforderungen. Es bringt nichts, wenn Sie Ihr eigenes Team von 50 Data Scientists beschäftigen, um ein Problem zu lösen, das sich leicht mit einer Standardlösung lösen lässt. (Für technisch versierte Leser gibt es einen interessanten Artikel von Thomas Nield, der ein konkretes Beispiel von Scheduling-Systemen durchgeht, für die es mehrere bestehende Algorithmen gibt, die wirklich effizient lösen, wodurch die Notwendigkeit entfällt, in Neuerfindungen zu investieren.)
Datenqualität ist die Grundlage. Machen Sie das zuerst richtig.
Vor allem, wenn Sie erwägen, in Data Science und insbesondere in ML und/oder KI zu investieren, müssen Sie unbedingt erkennen, dass die Grundlage für jedes mögliche erfolgreiche Ergebnis die Qualität der Daten ist, die Sie für Ihr Team und zur Verfügung haben seine Modelle oder Werkzeuge. Müll rein, Müll raus, wie das Sprichwort sagt.
Ein Team von Doktoranden kann durchaus ein Bilderkennungssystem für maschinelles Lernen für Sie entwickeln, das sogar das übertrifft, was die großen Geschütze heute haben. Aber wenn Sie es mit sieben Bildern von Hunden trainieren, die als Katzen gekennzeichnet sind, wird es nur spektakulär scheitern.
Qualität reicht natürlich noch weiter, und jeder Data Scientist oder Data Engineer, der sein Geld wert ist, wird verlangen, dass Sie sich zuerst darauf konzentrieren. Dabei sind Genauigkeit, Präzision, Rückruf, Aktualität und Herkunft wichtige Überlegungen, aber was oft kaum mehr als ein Lippenbekenntnis ist, definiert, was Qualität in Ihrem speziellen Kontext ausmacht. Ähnlich wie bei den Vanity-Metriken, die Unternehmen gerne anpreisen (denken Sie „30 Millionen Menschen haben meine App heruntergeladen“, was nichts darüber aussagt, wie viele von ihnen sie tatsächlich verwenden), haben Sie gewonnen, wenn Sie nicht richtig überlegen, was Qualität ausmacht erreiche es nicht.
Stellen Sie sich einen Datensatz vor, der die Anwesenheit von Kindern in einem Haushalt und deren Alter betrifft. Wenn Sie Baby-Strampler an Eltern mit Neugeborenen verkaufen, dann sind Pünktlichkeit und Präzision entscheidend. Ihr Zielmarkt ist eng, und wenn Sie ein paar Wochen zu spät kommen, haben Sie das Ziel verfehlt. Wenn Sie jedoch Familien-Brettspiele verkaufen, spielt es kaum eine Rolle, ob Sie ein paar Jahre daneben liegen, wenn Ihre Genauigkeit gut ist. Es sind die gleichen Daten, aber eine andere Qualitätsbewertung.
KI und ML werden ein grundlegender Bestandteil unserer Zukunft sein. Ich behaupte nicht, dass die heutigen Unternehmen keine erstklassigen Datenwissenschaftler beschäftigen sollten. Ich sage lediglich, dass Unternehmensleiter sicherstellen müssen, dass sie Einstellungen nach einer klar definierten Strategie und einem klar definierten Bedarf vornehmen, und sicherstellen müssen, dass sie über saubere, gut (und ethisch vertretbar) gewonnene Daten verfügen, die ausreichend stichhaltig sind, um eine signifikante Modellierung darauf zu rechtfertigen. Indem Sie sich auf diese Weise konzentrieren, können Sie sicherstellen, dass die Ressourcen Ihres Unternehmens – sowie die Zeit und das Talent Ihrer Data Scientists – sinnvoll eingesetzt werden.