Saatnya untuk Pemeriksaan Realitas AI/ML
Diterbitkan: 2020-06-29Rohan Chandran adalah Chief Product Officer di Infogroup.
Ilmu data mengalami momennya dalam sorotan, dengan disiplin penting ini meletakkan dasar bagi kemajuan kecerdasan buatan (AI) dan pembelajaran mesin (ML) baru setiap hari. Sebagai manusia dan sebagai pemimpin bisnis, keinginan kita untuk yang terbaru dan terhebat selalu kuat, dan tidak terkecuali dalam hal ini. Saat ini, semua orang ingin meningkatkan praktik ilmu data mereka dan menunjukkan penggunaan AI dan ML dalam produk dan layanan mereka.
Kami berlebihan. Kami adalah solusi over-engineering. Kami mempekerjakan orang untuk pekerjaan yang ternyata tidak seperti yang diiklankan dan kemudian membubarkan tim setahun kemudian, atau bertanya-tanya mengapa mereka tidak terlibat dan secara alami menarik. Dengan melakukan itu, kami juga mendorong ekosistem yang mendorong orang untuk meningkatkan kredensial mereka dan mencari pekerjaan ilmu data yang sebenarnya tidak mereka kuasai, sehingga mempersulit pemberi kerja sejati untuk merekrut talenta yang tepat. Ekonomi palsu tidak bertahan.
Biar saya perjelas: Ilmu data adalah bidang penting dan bahkan revolusioner dalam lanskap bisnis modern. Teknik-teknik baru yang sedang dikembangkan untuk memahami dan mengoperasionalkan data, semakin secara otomatis, bersifat transformatif. Cara kita berfungsi berubah, dan harus terus begitu. Karena itu, dalam keinginan mutlak kami untuk menjadi bagian dari kisah AI dan ML, kami menenggelamkan diri dalam ketidakefisienan. Izinkan saya untuk menjelaskan.
Masalah Sederhana Paling Sering Manfaatkan Solusi Sederhana
YouTube penuh dengan video mesin Rube Goldberg yang rumit. (Jika Anda belum pernah melihatnya, saya sangat merekomendasikan—berjam-jam bersenang-senang sambil berlindung di tempat!) Sehebat apapun perangkat ini, mereka—menurut definisi—solusi kompleks yang tidak perlu untuk masalah sederhana. Pendekatan ini menjadi berbahaya ketika kita menerjemahkannya ke dunia bisnis dengan memulai dengan pilihan teknologi (“Mari kita pastikan produk kita menggunakan AI!”) daripada memulai dengan masalah bisnis.
Sebagai contoh, perhatikan Toyota saya yang berusia 14 tahun. Saya memiliki fob kunci yang ada di saku saya. Bahkan jika saya memiliki tas di masing-masing tangan, saya bisa berjalan ke mobil dan membuka pintu. Tidak diperlukan usaha ekstra.
Kemudian datanglah ponsel dengan komunikasi jarak dekat (NFC) built in. Tiba-tiba, produsen mobil bergegas untuk menunjukkan bagaimana Anda dapat menggunakan ponsel berkemampuan NFC untuk membuka pintu mobil Anda. Untuk melakukannya, Anda cukup mengeluarkan ponsel dari saku, menempelkannya ke tag NFC di jendela, lalu menarik pintu hingga terbuka.
Contoh ini mencentang semua kotak untuk produsen mobil yang ditugaskan menggunakan teknologi terbaru. Ini memungkinkan seorang eksekutif untuk naik ke atas panggung dan berbicara tentang bagaimana Anda dapat menggunakan ponsel Anda untuk membuka kunci mobil Anda. Tapi sekarang, saya harus berhenti di mobil saya, meletakkan tas belanjaan saya, mengeluarkan telepon saya, mengangkatnya, memasukkannya kembali ke saku saya, mengambil tas saya, dan kemudian masuk ke mobil. Pengalaman saya yang elegan dan mulus menjadi penuh dengan poin-poin menyakitkan.
Sayangnya, inilah yang dilakukan terlalu banyak orang ketika mereka mencoba mengembangkan model kompleks, atau membangun solusi AI, untuk melakukan tugas yang memiliki solusi sederhana. Melakukan hal itu hanya untuk kepentingan itu adalah pemborosan sumber daya dan kerugian ekonomi jangka panjang. Organisasi yang paling cerdas menunjukkan pengekangan dan menyadari bahwa solusi terbaik sering muncul dalam konteks sumber daya yang langka dan insentif yang selaras dengan penyelesaian nilai pelanggan dan bisnis, daripada kotak centang teknologi.
Biaya Peluang: Jika Tidak Rusak, Jangan Perbaiki.
Contoh key fob juga berfungsi untuk mengilustrasikan kebenaran lama tentang tidak memfokuskan upaya pada masalah yang dipecahkan. Jika Anda mencoba menjalankan bisnis secara efisien, maka Anda ingin benar-benar fokus pada nilai tambah berbeda yang Anda berikan. Ketika masalah telah dipecahkan oleh orang lain—dan mari kita hadapi itu, sebagian besar masalah kita tidak seunik yang mungkin ingin kita percayai—manfaatkan pekerjaan mereka. Berdiri di atas bahu raksasa.
Alih-alih membangun tim ilmuwan data untuk menyelesaikan semuanya sendiri, pertama-tama jelajahi ketersediaan solusi open-source atau yang dapat dilisensikan di tempat lain. Ketika AI dan pembelajaran mesin matang sebagai disiplin ilmu, kami menemukan bahwa banyak pemain terbesar di bidang ini—termasuk Amazon, Google, dan lainnya—telah banyak berinvestasi dalam menciptakan algoritme dan alat yang kuat yang dapat dengan mudah digunakan atau diadaptasi untuk memecahkan masalah apa pun. sejumlah tantangan data. Tidak ada yang bisa diperoleh dengan mempekerjakan tim Anda sendiri yang terdiri dari 50 ilmuwan data untuk memecahkan masalah yang dapat dengan mudah diatasi dengan solusi siap pakai. (Untuk pembaca yang berpikiran teknis, ada artikel menarik oleh Thomas Nield yang membahas contoh spesifik sistem penjadwalan, di mana ada beberapa algoritme yang ada yang memecahkan dengan sangat efisien, meniadakan kebutuhan untuk berinvestasi dalam penemuan kembali.)
Kualitas Data Adalah Dasarnya. Dapatkan Itu Benar Pertama.
Di atas segalanya, ketika Anda mempertimbangkan untuk berinvestasi dalam ilmu data, dan terlebih lagi dalam ML dan/atau AI, Anda harus menyadari bahwa dasar untuk setiap hasil yang berpotensi sukses adalah kualitas data yang Anda miliki untuk tim Anda dan model atau alatnya. Sampah masuk, sampah keluar, seperti kata pepatah.
Sebuah tim PhD mungkin mengembangkan sistem pengenalan gambar pembelajaran mesin untuk Anda yang bahkan melebihi apa yang dimiliki senjata besar saat ini. Tetapi jika Anda melatihnya dengan tujuh gambar anjing yang dicap sebagai kucing, satu-satunya hal yang akan dilakukannya adalah gagal secara spektakuler.
Kualitas, tentu saja, meluas lebih dalam dari itu, dan ilmuwan data atau insinyur data mana pun yang sepadan dengan garam mereka akan menuntut Anda untuk fokus di sini terlebih dahulu. Saat Anda melakukannya, akurasi, presisi, ingatan, ketepatan waktu, dan asal adalah pertimbangan penting, tetapi apa yang sering kali dibayar sedikit lebih dari sekadar basa-basi adalah mendefinisikan apa yang merupakan kualitas dalam konteks khusus Anda. Sama seperti metrik kesombongan yang suka dijalankan oleh perusahaan (pikirkan "30 juta orang mengunduh aplikasi saya," yang tidak memberi tahu Anda tentang berapa banyak dari mereka yang benar-benar menggunakannya), jika Anda tidak mempertimbangkan dengan benar apa yang merupakan kualitas, Anda menang tidak mencapainya.
Pertimbangkan kumpulan data yang menyangkut keberadaan anak-anak dalam sebuah rumah tangga, dan usia mereka. Jika Anda menjual baju bayi kepada orang tua dengan bayi baru lahir, maka ketepatan waktu dan ketepatan sangat penting. Target pasar Anda ketat, dan jika Anda terlambat beberapa minggu, Anda melewatkan sasaran. Namun, jika Anda menjual permainan papan keluarga, mungkin tidak masalah jika Anda pergi beberapa tahun jika akurasi Anda bagus. Ini data yang sama, tetapi penilaian kualitas yang berbeda.
AI dan ML akan menjadi bagian mendasar dari masa depan kita. Saya tidak menegaskan bahwa perusahaan saat ini tidak boleh mempekerjakan ilmuwan data terbaik di kelasnya. Saya hanya mengatakan bahwa para pemimpin perusahaan perlu memastikan bahwa mereka merekrut dengan strategi dan kebutuhan yang terdefinisi dengan baik, dan memastikan bahwa mereka memiliki data yang bersih, baik (dan etis) bersumber yang cukup substantif untuk menjamin pemodelan signifikan di atasnya. Dengan berfokus dengan cara ini, Anda dapat memastikan bahwa sumber daya organisasi Anda — serta waktu dan bakat ilmuwan data Anda — dimanfaatkan dengan baik.