AI/ML Gerçeklik Kontrolü Zamanı
Yayınlanan: 2020-06-29Rohan Chandran, Infogroup'ta Ürün Müdürüdür.
Veri bilimi, her gün yeni yapay zeka (AI) ve makine öğrenimi (ML) gelişmeleri için zemin hazırlayan bu hayati disiplin ile ilgi odağındaki anını yaşıyor. İnsanlar ve iş liderleri olarak, en yeniye ve en iyiye olan iştahımız her zaman güçlüdür ve bu durumda bir istisna değildir. Şu anda herkes veri bilimi uygulamalarını hızlandırmak ve ürün ve hizmetlerinde AI ve ML kullanımına işaret etmek istiyor.
Aşırıya kaçıyoruz. Biz aşırı mühendislik çözümleriyiz. Reklamı yapılan işler için insanları işe alıyoruz ve sonra ya bir yıl sonra ekipleri dağıtıyoruz ya da neden meşgul olmadıklarını ve doğal olarak yıprattıklarını merak ediyoruz. Bunu yaparken, aynı zamanda insanları kimlik bilgilerini artırmaya ve gerçekten kalifiye olmadıkları veri bilimi işleri aramaya teşvik eden ve gerçek işverenlerin doğru yetenekleri işe almasını zorlaştıran bir ekosistemi de besliyoruz. Yanlış ekonomiler ayakta kalamaz.
Yine de açıklığa kavuşturmama izin verin: Veri bilimi, modern iş dünyasında önemli ve hatta devrim niteliğinde bir alandır. Verileri anlamak ve operasyonel hale getirmek için geliştirilmekte olan ve giderek artan bir şekilde otomatikleştirilmiş yeni teknikler dönüştürücü niteliktedir. Çalışma şeklimiz değişiyor ve değişmeye devam etmeli. Bununla birlikte, AI ve ML hikayesinin bir parçası olma konusundaki mutlak arzumuzda kendimizi verimsizliğe boğuyoruz. Açıklamama izin ver.
Basit Sorunlar Çoğu Zaman Basit Çözümlerden Yararlanır
YouTube, karmaşık Rube Goldberg makinelerinin videolarıyla dolu. (Onları görmediyseniz, şiddetle tavsiye ederim - yerinde barınarak saatlerce eğlenin!) Bu cihazlar ne kadar dikkat çekici olsalar da - tanım gereği - basit bir soruna gereksiz yere karmaşık bir çözüm. Bu yaklaşım, iş probleminden başlamak yerine bir teknoloji seçimiyle (“Ürünlerimizin yapay zeka kullandığından emin olalım!”) başlayarak iş dünyasına tercüme ettiğimizde tehlikeli hale geliyor.
Örnek olarak 14 yaşındaki Toyota'mı düşünün. Cebimde oturan bir anahtarlık var. Her iki elimde de birer çanta olsa bile, arabaya kadar yürüyüp kapıyı açabiliyorum. Ekstra çaba gerekmez.
Ardından, yerleşik yakın alan iletişimine (NFC) sahip telefonlar geldi. Birden otomobil üreticileri, arabanızın kapısını açmak için NFC özellikli telefonunuzu nasıl kullanabileceğinizi göstermek için acele etmeye başladılar. Bunu yapmak için, telefonu cebinizden çıkarmanız, penceredeki NFC etiketine doğru tutmanız ve ardından kapıyı çekip açmanız yeterliydi.
Bu örnek, en son teknolojileri kullanmakla görevlendirilmiş otomobil üreticileri için tüm kutuları kontrol etmektedir. Bir yöneticinin sahneye çıkmasına ve arabanızın kilidini açmak için telefonunuzu nasıl kullanabileceğiniz hakkında konuşmasına olanak tanır. Ama şimdi arabamda durmam, market poşetlerimi bırakmam, telefonumu çıkarmam, tutmam, cebime geri koymam, poşetleri almam ve sonra arabaya binmem gerekiyor. Zarif ve kusursuz deneyimim, acı noktalarla dolup taştı.
Ne yazık ki, mevcut basit çözümlere sahip görevleri gerçekleştirmek için karmaşık modeller geliştirmeye veya bir AI çözümü oluşturmaya çalışırken çok fazla insanın yaptığı şey budur. Bunu sırf bunun iyiliği için yapmak, kaynak israfı ve uzun vadeli ekonomik zarardır. En bilgili kuruluşlar, kısıtlama gösterir ve en iyi çözümlerin genellikle teknolojik onay kutuları yerine müşteri ve iş değeri için çözümle uyumlu kıt kaynaklar ve teşvikler bağlamında ortaya çıktığını kabul eder.
Fırsat Maliyeti: Bozulmadıysa Tamir Etmeyin.
Anahtarlık örneği aynı zamanda, çabayı çözülmüş sorunlara odaklamama konusundaki eski gerçeği göstermeye de hizmet ediyor. Bir işi verimli bir şekilde yürütmeye çalışıyorsanız, sağladığınız farklı katma değere sıkı sıkıya odaklanmak istersiniz. Sorunların başkaları tarafından çözüldüğü yerlerde -ki bununla yüzleşelim, sorunlarımızın çoğu inanmak isteyebileceğimiz kadar benzersiz değildir- onların çalışmalarından yararlanın. Devlerin omuzlarında durun.
Her şeyi kurum içinde çözmek için bir veri bilimci ekibi oluşturmak yerine, önce başka bir yerde açık kaynaklı veya lisanslanabilir çözümlerin kullanılabilirliğini araştırın. AI ve makine öğrenimi disiplinler olarak olgunlaştıkça, Amazon, Google ve diğerleri de dahil olmak üzere bu alandaki en büyük oyuncuların çoğunun, herhangi bir sorunu çözmek için kolayca kullanılabilecek veya uyarlanabilecek sağlam algoritmalar ve araçlar oluşturmaya zaten büyük yatırımlar yaptığını görüyoruz. veri zorluklarının sayısı. Hazır bir çözümle kolayca çözülebilecek bir sorunu çözmek için 50 veri bilimciden oluşan kendi ekibinizi istihdam ederek hiçbir şey kazanamazsınız. (Teknik olarak düşünen okuyucular için, Thomas Nield'in, yeniden icat etmeye yatırım yapma ihtiyacını ortadan kaldırarak, gerçekten verimli bir şekilde çözen birkaç mevcut algoritmanın bulunduğu, belirli bir zamanlama sistemleri örneğini inceleyen ilginç bir makalesi var.)
Veri Kalitesi Temeldir. İlk Önce Bunu Sağlayın.
Her şeyden önce, veri bilimine ve dahası ML ve/veya yapay zekaya yatırım yapmayı düşündüğünüzde, herhangi bir potansiyel başarılı sonucun temelinin ekibiniz için mevcut olan verilerin kalitesi olduğunu kabul etmeniz zorunludur ve modelleri veya araçları. Çöp içeri, çöp dışarı, söylendiği gibi.
Doktoralardan oluşan bir ekip, sizin için günümüzdeki büyük silahların sahip olduklarını bile geride bırakan bir makine öğrenimi görüntü tanıma sistemi geliştirebilir. Ama onu kedi olarak etiketlenmiş yedi köpek resmiyle eğitirseniz, yapacağı tek şey olağanüstü bir şekilde başarısız olur.
Kalite, elbette, bundan daha derine uzanır ve her veri bilimcisi veya veri mühendisi, her şeyden önce buraya odaklanmanızı isteyecektir. Bunu yaptığınızda, doğruluk, kesinlik, hatırlama, güncellik ve köken önemli hususlardır, ancak genellikle sözde hizmetten biraz daha fazla ödenen şey, sizin özel bağlamınızda kaliteyi neyin oluşturduğunu tanımlamaktır. Şirketlerin denemeye bayıldığı gösteriş ölçütlerine çok benzer şekilde ("uygulamamı 30 milyon kişinin indirdiğini" düşünün, bu da size kaç kişinin uygulamayı gerçekten kullandığı hakkında hiçbir şey söylemez), kaliteyi neyin oluşturduğunu düzgün bir şekilde düşünmezseniz, kazandınız. onu elde edemezsiniz.
Bir hanedeki çocukların varlığına ve yaşlarına ilişkin bir veri seti düşünün. Yeni doğmuş bebekleri olan ebeveynlere bebek tulumları satıyorsanız, dakiklik ve hassasiyet çok önemlidir. Hedef pazarınız dar ve birkaç hafta geç kaldıysanız hedefi kaçırdınız. Bununla birlikte, aile masa oyunları satıyorsanız, doğruluğunuz iyiyse, birkaç yıl uzakta olmanızın pek bir önemi olmayabilir. Aynı veriler, ancak farklı bir kalite değerlendirmesi.
AI ve ML geleceğimizin temel bir parçası olacak. Bugünün işletmelerinin sınıfının en iyisi veri bilimcileri çalıştırmaması gerektiğini iddia etmiyorum. Ben sadece, şirket liderlerinin iyi tanımlanmış bir strateji ve ihtiyaca göre işe alım yaptıklarından ve bunun üzerinde önemli bir modellemeyi garanti edecek kadar sağlam, temiz, iyi (ve etik olarak) kaynaklı verilere sahip olduklarından emin olmaları gerektiğini söylüyorum. Bu şekilde odaklanarak, veri bilimcilerinizin zamanının ve yeteneğinin yanı sıra kuruluşunuzun kaynaklarının da iyi bir şekilde kullanılmasını sağlayabilirsiniz.