Bilinmesi Gereken Farklı Regresyon Analizi Türleri
Yayınlanan: 2020-03-05Regresyon analizi, bağımlı bir değişken ile tek veya çoklu bağımsız değişken arasında ilişki kurmaya çalışan metodolojidir.
Regresyon doğal olarak istatistiksel bir kavramdır, ancak uygulamalarını finans, yatırım, borsa gibi işle ilgili birçok alanda ve ayrıca bilim ve mühendislik gibi alanlarda bulmaktadır.
İnsanlığın geleceğini belirleyen veri bilimi, makine öğrenimi ve Yapay Zeka biçimindeki bazı gelecek vaat eden regresyon analizleri uygulamaları vardır.
- terminolojiler
- Farklı Regresyon Analizi Türleri
- Ne için kullanılır?
- Doğru Model Nasıl Seçilir
Regresyon ile ilgili terminolojiler
Regresyon analizi türlerini anlamak için ilgili terminolojileri anlamak faydalıdır.
aykırı değerler
Aykırı değerler, bir grafikte veri çizimleriyle görülebilir. Regresyon analizinde(1), aykırı değerler, diğer noktalardan oluşan bulutun önemli ölçüde dışında kalan grafikteki noktalardır. Aykırı değerler önemlidir çünkü bir regresyon analizinin sonucunu büyük ölçüde etkileyebilirler. Bu kavramı anlamak için, bir binanın kazançları açısından ortalama finansal geçmişe sahip profesyonellerle dolu olduğunu varsayalım.
Hepsinin yıllık ortalama yüz bin dolar maaşı var. Aniden, Bill Gates ve Jeff Bezos binaya giriyor ve bu iki milyarderin maaşlarını eklediğinizde, ortalama maaş büyük ölçüde yanlış oluyor. Bu iki tanınmış beyefendinin maaşları bu örnekte aykırı değerlerdir.
çoklu doğrusallık
Regresyon analizinde, iki veya daha fazla girdi değişkeni arasındaki korelasyona bakıldığında, bir veya daha fazla girdi değişkeninin eklenmesi gerçekleştiğinde, modelin gerçek dünya hakkında daha şeffaf hale getirmediği gözlemlenebilir.
Girdi değişkenlerinin birbirleriyle nasıl ilişkili olduğunu bulmak çok önemlidir. Regresyon modelinin çoklu doğrusallığını ölçmek, girdi değişkenleri arasındaki ilişkiyi bulmanın bir yoludur. Örnek olarak, öğrenmek istediğiniz bir modelle karşılaşabilirsiniz. bir kişinin belirli bir yaşta maaşını ne belirler. Eğitim durumu, yaş gibi bağımsız değişkenler (faktörler) ve bir bireyin ortalama maaşını etkileyen diğer birçok faktör dikkate alınır.
Ancak, daha ileri gitmeden ve modelinizdeki her faktörü Güneş'in altına atmadan önce, bunların nasıl bir ilişki içinde olduklarını (birliktelikler arası) bilmeniz gerekir. Çoklu doğrusallık çok yüksek olursa, verilerde bozulmaya neden olur ve model bozulur.
heteroskedastisite
Değişken varyans (bazen değişen varyans olarak yazılır), belirli bir süre boyunca ölçülen bir değişkenin standart hatasının (SE) okunması sabit olmadığında ortaya çıkar.
Değişen varyans sergileyen bu tür veriler üzerinde çalışan herhangi bir regresyon analizi, en azından yanlı katsayılar verir ve sonuçları mahveder.
Aşırı uyum gösterme
Bir regresyon analizindeki fazla uydurma, değişkenler arasındaki ilişkiyi verimli bir şekilde tanımlamak yerine değişkenler rastgele hatalar göstermeye başladığında meydana gelir. Fazla takma, nüfusun gerçek temsilinden ziyade çok fazla gürültü üretir. Modelin sonucu artık gerçekçi değil.Modelinizi mümkün olduğunca gerçeğe yakın hale getirmeniz gerekiyor.Gerçek dünyadan bir kıyafet örneği olarak. Gerçek dünya örneğinden yola çıkarak donatmayı tanımlayan olası en iyi kelime “aşırı genelleme”dir. Hata veya yanlılık arttığında, sonuç olarak gerçekçi değerler belirlenemez.
yetersiz
Eksik uydurma, değişkenlerin sayısı belirli bir modele pek uymadığında gerçekleşir ve çıktı doğru kalmaz. Bir regresyon analizinden başarılı sonuçlar elde etmek için değişkenlerin optimum değerlerine ihtiyacınız vardır, bu nedenle elde edilen model gerçeğe yakındır. Kısacası, değişkenler optimize edilmediğinde veya model verilere verimli bir şekilde uymadığında buna denir. bir iç çamaşırı.
Regresyon Analizi Türleri
Herhangi bir Regresyon biçiminde iki tür değişken vardır. Biri bağımsız değişkenler veya açıklayıcı değişkenler olarak da adlandırılırlar, girdiler için kullanılırlar. Diğer değişken türü, tahmin edici olarak da bilinen bağımlı bir değişkendir. Bulmaya çalıştığınız değer veya modelin sonucudur.
Aşağıda, farklı regresyon analizi türleri açıklanmaktadır.
Doğrusal Regresyon
Doğrusal regresyon iki tür değişkenle ilgilenir. Bir değişkene bağımsız değişken denir ve diğer değişken türü bağımlı değişkendir.
Bağımsız değişken, kartezyen düzlemin x ekseni boyunca değişir ve bağımlı değişken, y ekseni boyunca değişir. Bu değişkenler sırasıyla “x” ve “y” dir. y'nin değeri x'e bağlıdır. x değiştiğinde, “y” artar veya azalır.
İki tür Doğrusal Regresyon vardır.- Basit Doğrusal Regresyon
- Çoklu doğrusal gerileme
- Basit Doğrusal Regresyon: Basit Doğrusal Regresyonda yalnızca bir bağımlı değişken ve bir bağımlı değişken vardır.
Basit doğrusal regresyon denklemi y=β_0+β_1 xBurada x bağımsız değişkeni temsil eder, regresyon doğrusu eğimidir ve y-kesişim noktasıdır. “y” bağımlı değişken veya sonuçtur.
- Çoklu Doğrusal Regresyon: Çoklu Doğrusal Regresyonda bağımlı değişken birdir, ancak birden fazla bağımsız değişkeniniz vardır.
Aşağıdaki denklem Çoklu Doğrusal Regresyonu temsil eder,y= β_0+β_1 x_1+⋯β_n x_n+ εBurada, y bağımlı değişkendir, y-kesme noktasıdır. modeldeki çoklu bağımsız değişkenleri ifade eder. "önyargı" veya "hata"dır. Önyargı veya hatayı en aza indirmek, gerçek dünya durumuna yakın bir model oluşturmak için birincil hedefimizdir.
Çok Değişkenli Regresyon
Çok Değişkenli Regresyon, birden çok bağımsız değişken girişi olan birden çok bağımlı değişkene sahip olması bakımından Çoklu Doğrusal Regresyondan farklıdır. Bağımlı değişkenler ( y_1,y_2 ,y_3 ….y_n) farklı formüllerdedir. Ve Ys'yi tahmin etmek için birden fazla bağımsız değişkene ( x_1, x_2, ….x_m ) sahiptir. Çok Değişkenli Regresyonda kullanılan veriler çoğunlukla diğer Regresyon Analizi türleriyle aynı tiptedir.
Lojistik Regresyon
Lojistik Regresyon, doğrusal Regresyondan sonra en popüler ikinci Regresyon şeklidir ve kullanımları biyoistatistik, tıp ve sosyal bilimleri kapsar.
Lojistik regresyon, aşağıdaki gibi Boole değerleriyle ilgilenir:- doğru ya da yanlış
- Evet veya Hayır
- büyük ya da küçük
- bir veya sıfır
Lojistik Regresyon, bir e-postanın "spam" veya "spam değil" olduğu gibi nesnelerin sınıflandırılmasında kullanılır.
Kısacası, lojistik Regresyonda “Doğru” veya “Yanlış” olabilen bir çıktı vardır. Ayrıca Lojistik Regresyon modellerinde tek bir girdi veya birden fazla girdi olabilir.
Polinom Regresyon
İlişkisi doğrusal olmayan değişkenlerle uğraşmamız gereken durumlar vardır. Böyle bir durumda modelimiz Doğrusal Regresyondaki gibi bir doğru değil bir eğridir. Böylece, polinom Regresyon olarak bilinen başka bir Regresyon biçimine sahibiz.
Polinom Regresyon denklemi, bir genellemesi aşağıda olan giriş değişkeni x'in artan güçleridir.
y= β_0+ β_1 x+〖β 〗_2 x^2+〖 β〗_3 〖 x〗^3+⋯β_n x^n+ ε
kantil regresyon
Nicel Regresyon tanımı pratikte olduğundan çok farklıdır. Nicelik, istatistikteki medyanın başka bir adıdır.
Nicel, çıktı verilerini iki eşit parçaya bölen nokta veya çizgidir. Y ekseninde bir çizgi şeklinde bir veri seti hayal edin. Veri seti tam olarak iki eşit parçaya bölünmüştür. Kuantilin değeri, bölünme noktasında 0,5 veya %50'dir.
Aynı notta, eşit olarak bölünmüş iki veri parçası, y ekseni boyunca tekrar eşit olarak bölünür. Bu sefer verileri dört eşit parçaya ayırdık ve grafiğin alt y eksenindeki yeni bölünme noktaları 0.25 veya %25'tir.
Benzer şekilde, üst y ekseni bölünmüş niceliği 0.75 veya %75'tir. Genel olarak nicelikler, verileri eşit parçalara veya gruplara ayıran çizgiler veya noktalardır.
Quantiles, verileri eşit büyüklükte yüzlerce gruba tükürür. Ancak gerçek dünyada, niceliğin tanımı çok daha esnektir.
Nicel regresyon, modelde yüksek değişen varyanslılığın mevcudiyeti olduğunda faydalıdır ve lineer model ortalama değerlere dayandığından ve kantiller medyan değerlerle daha kesin olabileceğinden lineer Regresyon sonucu tahmin etmek için yeterince doğru değildir.
Sırt Regresyonu
Sırt regresyonu, “Düzenlileştirme” adı verilen bir teknik kullanır. Düzenleme, test verilerinde başarısız olan ancak eğitim verilerini aktaran modeller için uygundur.
Sırt regresyonu, modeldeki değişkenlerin çoğu yararlı olduğunda en iyi sonucu verir.
Örnek veriler çoklu doğrusallık gösterdiğinde, istenmeyen iki şey olur,
- Tahmin değişkenlerinin katsayılarının En Küçük Kare tahminleri yüksek hatalar verir.
- Standart hatalarda enflasyon var.
Ridge Regresyon, çoklu bağlantı varlığında regresyon katsayılarının stabilizasyonu için bir tekniktir.
Kement Regresyonu
Kement, “En Az Mutlak Büzülme ve Seçim Operatörü” anlamına gelir. Lasso Regresyon, çok sayıda işe yaramaz değişkeniniz olduğunda en iyi performansı gösterir. Kement Regresyonu, Ridge regresyonuna benzer, ancak bazı farklılıklar onu benzersiz kılar.
Ridge Regresyon ve Lasso Regresyon, çoklu bağlantının mevcut olduğu aynı senaryolar için uygulamalara sahiptir. Ancak, Ridge Regresyon uzun vadeli tahminler için uygundur.
Kement Regresyonu verilere küçültme uygular. Veri değerleri, medyan veya ortalama gibi merkezi bir noktaya doğru küçülür.
Veri modellerinin basitleştirilmesi ve seyrek olması, Kement Regresyonunun en iyi yaptığı işlevlerdir. Başka bir deyişle, veri modelleri doğru sonuçlar için optimum parametrelere sahip olmalıdır.
Temel Bileşen Regresyonu (PCR)
Temel Bileşen Analizi, verilerin boyutsallığını azaltan x değişkenine bir uygulamaya sahiptir. Yinelemeli bir süreçte çoğu varyasyonla veri kümesinin çıkarılmasını içerir.
Süreç, çok boyutlu bir veri setini analiz edebilmesi için yinelemeli olduğundan, Temel Bileşen Regresyonu, sıradan En Küçük Kareler Regresyonunda bulunan boyutsallık ve doğrusallık problemlerinin üstesinden gelir.
Elastik Net Regresyon
Elastik Net Regresyon, yorumlama kolaylığı için bir modeli basitleştirir. Bir modelin tonlarca değişkeni olabilir (diğer bir deyişle parametreler); belirli modellerde milyonlara kadar çıkabilirler. Böyle bir modelde hangi değişkenlerin yararlı, hangilerinin yararsız olduğunu belirlemek mümkün değildir.
Böyle bir durumda Ridge Regresyon ve Lasso regresyon arasından hangi regresyon tipini seçeceğinizi bilemezsiniz. Burada, modeli basitleştirmek için Elastik Net Regresyon devreye giriyor.
Elastic-Net Regresyon, Ridge Regresyon cezasını Kement Regresyon cezasıyla birleştirir ve her iki dünyanın da en iyisini verir. Ayrıca ilişkili değişkenlerle daha iyi çalışır.
Kısmi En Küçük Kareler (PLS)
Kısmi En Küçük Kareler hem açıklayıcı hem de bağımlı değişkenleri dikkate alır. Bu tip Regresyonun altında yatan ilke, x ve y değişkenlerinin yinelemeli bir süreçte gizli yapılara ayrıştırılmasıdır.
PLS çoklu bağlantı ile başa çıkabilir. x ve y ile ilgili veri yapılarını dikkate alır ve verilerin yorumlanması için size ayrıntılı görsel sonuçlar sunar. Birkaç değişken dikkate alınabilir.
Destek Vektör Regresyonu
Destek Vektör Regresyonu (SVR), sürekli bir işlevle çalışan bir algoritmadır. Bu anlamda Destek Vektör Makinesi (SVM) sınıflandırma problemleriyle ilgilenir. SVR, sürekli sıralı değişkenleri tahmin eder.
Basit Regresyonda, Destek Vektör Regresyonu hatanın eşiğini bulurken hatayı en aza indirmeye vurgu yapılmalıdır.
Sıralı Regresyon
Lojistik Regresyon iki kategoriyle ilgilenir, ancak Ordinal Regresyonda (diğer adıyla Ordinal Lojistik Regresyon), kesin sıralama varsayımıyla üç veya daha fazla kategori devreye girer.
Sıralı Regresyon, bir veya daha fazla bağımsız değişken mevcut olduğunda sıralı bağımlı değişkeni tahmin etmeye yardımcı olur.
Poisson Regresyonu
Poisson Regresyonunda, olayın meydana geldiği sayı veya hız ana odak noktasıdır.
Poisson Regresyonunda olayın meydana gelme hızını ölçüyoruz. Başka bir deyişle, olayın zaman içinde meydana gelme (sayım) sayısını modelleriz. Poisson Regresyonunda zaman sabittir ve olayın sayısını ölçeriz.
Negatif Binom Regresyon
Ayrık (sayım) veri setini modellemek yararlıdır. Aynı notta, Negatif Binom Regresyon, verilerin, çizdiğinizde verilerin dağılımının çok fazla olduğu ortalamaya kıyasla daha yüksek bir varyansa sahip olduğunda yardımcı olur.
Negatif Binom Modeli, Poisson Regresyonuna dayalı modelin yaptığı gibi, değişkenin ortalamaya eşit olduğunu varsaymaz.
Yarı Poisson Regresyonu
Yarı Poisson Regresyonu, Poisson Regresyonunun genelleştirilmesidir. Daha önce bahsedildiği gibi, Poisson Regresyon Modeli, varyansın ortalamaya eşit olduğuna dair genellikle haksız bir varsayıma dayanır.
Quasi Poisson Modeli, varyans ortalamanın lineer fonksiyonu olduğunda ve aynı zamanda ortalamadan daha yüksek olduğunda devreye girer. Quasi Poisson'un uygulanabilir olması daha uygun olduğu senaryodur.
Cox Regresyonu
Cox Regresyonu (diğer adıyla Orantılı Tehlikeler Regresyonu), belirli bir olayın meydana gelmesi için geçen süre boyunca çeşitli değişkenlerin etkilerini araştırır.
Cox Regresyonunun faydalı bulunabileceği aşağıdaki olayları göz önünde bulundurun,
- İlk kalp krizinden sonra ikinci kalp krizi için geçen süre.
- İlk kazadan sonra ikinci kaza için geçen süre.
- Kanser teşhisinden sonra ölüme kadar geçen süre.
Olay zamanı verileri, cox regresyonunun uygulanması için hayati önem taşır.
Tobit Regresyonu
Tobit Regresyon, bağımlı değişkende sansür bulunduğunda doğrusal bir ilişkinin tahmininde kullanışlı olur. Sansür, tüm bağımsız değişkenlerin gözlemlenmesidir. Bağımlı değişkenin değerinin gerçek hesabı, yalnızca sınırlı bir gözlem aralığındadır.
Bayesian Regresyon
Bayesian Regresyon, nokta tahmininden ziyade olasılık dağılımına dayanır. Sonuç olarak, çıktı veya “y” tek bir değer değildir. Bir olasılık dağılımıdır. Bildiğimiz gibi, olasılık dağılımı bir değer değil, matematiksel bir fonksiyondur. Olasılık dağılımı, bir deneyde olası sonuçları verir.
Olasılık dağılımına dayalı lineer regresyon modelinin formülasyonunu oluşturduğumuzda aşağıdaki ifadeyi alırız.
y ˜ N(β^TX,σ^2 I)- Çıktı (y), ortalama ve varyansa bağlı olarak normal bir Gauss Dağılımından hesaplanır.
- Ağırlık matrisinin (β) devrik (T), tahmin matrisi (X) ile çarpılarak elde edilir.
- Varyans, standart sapmanın karesinin (σ^2 ) Özdeşlik matrisi (I) ile çarpımıdır.
(Modelin çok boyutlu formülasyonu değerlendirilmektedir)
En Küçük Mutlak Sapma (LAD) Regresyonu
En Küçük Mutlak Sapma, doğrusal modelleri analiz etmek için En Küçük Kare yöntemine en yaygın olarak bilinen alternatiftir. En Küçük Kare yönteminde karesi alınan hataların toplamını en aza indirdiğimizi biliyoruz, ancak LAD'de hataların mutlak değerlerinin toplamını en aza indiriyoruz. Bir dizi veriye yakından uyan bir fonksiyon bulmaya çalışır.
Verilerimizin basit olduğu bir durumda, En Küçük Mutlak Sapma iki boyutlu Kartezyen Düzlemde düz bir çizgidir.
En Az Mutlak'ın formülasyonunu anlamak çok basittir. Veri setimizin iki değişken noktasından ( (x_i ,y_i) ve i=1,2,3,4,5……n) oluştuğunu varsayalım.
Amacımız, aşağıda gösterildiği gibi (~)'ye yaklaşık olarak eşit olan bir f fonksiyonu bulmaktır.
f(x_i ) ~ y_i
İddia, f fonksiyonunun, hesaplamamız gereken bazı parametreleri içeren belirli bir biçimde olduğudur. Burada dikkat edilmesi gereken nokta, f fonksiyonunun I sayıda x parametreye (veya bağımsız değişkenlere veya açıklayıcı değişkenlere) sahip olabileceğidir.
Hataların (veya artıkların) mutlak değerlerinin aşağıdaki toplamını en aza indirecek parametre değerlerini bulmaya çalışacağız.
S = ∑_(i=1)^n▒〖|y_i 〗-f(x_(i) )Ekolojik Regresyon
Ekolojik Regresyon, çoğunlukla siyaset bilimleri ve tarih gibi konularda etkilidir. Teknik, makro düzeyde sayım yapmamızı ve mikro düzeyde tahminler yapmamızı sağlar.
Ekolojik Regresyon, bireylerin farklı hizipler ve toplum grupları arasındaki oy verme davranışlarını belirleyebilir. Tahmin, önceki hesaplardan toplanan verilere dayanmaktadır.
Ekolojik veriler, belirli bir bölgedeki, gruplardaki, nesnelerdeki veya zaman içindeki sayımlara dayanmaktadır. Kısacası, toplu veriler, bireylere indirgenmiş davranışlar hakkında bilgi edinmemize yardımcı olur.
Regresyon Analizi Ne İçin Kullanılır?
Regresyon analizi, çeşitli iş hedeflerinin elde edilmesinde faydalıdır.
Tahmine Dayalı Analiz
En öne çıkan uygulamalardan biri, belirli iş olaylarının daha doğru tahmin edilmesini sağlayan tahmine dayalı analizdir. Tahmine dayalı analiz türlerinden biri, bir ürünün satışlarındaki artışı ölçen "talep analizi"dir. Yeni piyasaya sürülen bir ürünün yanı sıra çalışan ürünlerin başarısı, pazarda doğru bir şekilde konumlandırılabilir.
Başka bir örnek olarak, Regresyon Analizi, ürün ve hizmetlerin reklamında uygulamalara sahiptir. Kaç müşterinin bir reklamla karşılaşma olasılığının olduğu Regresyon Analizi ile tahmin edilebilir. Satış ve pazarlama profesyonellerinin promosyon malzemelerinin teklif değerini belirlemesine yardımcı olur.
Regresyon Analizi, sigorta şirketleri için de yararlı bir araçtır. Sigorta şirketleri bunu poliçe sahiplerinin kredisini bulmak ve müşterilerinden ileri sürülmesi muhtemel tazminat taleplerinin sayısını tahmin etmek için kullanır.
Operasyonel verimlilik
Kuruluşlar, operasyonlarını optimize etmek için Regresyon Analizini kullanarak ciddi kararlar alır.
Veriye dayalı kararlar, şüpheli kararları, içgüdüsel duygularla yapılan yanlış tahminleri ve şirket politikalarını ekarte edebilir.
Regresif Analiz, yönetim sanatını bir bilime dönüştürüyor. Örnek olarak, bir çağrı merkezindeki veya müşteri hizmetleri departmanındaki şikayet sayısı ile bir arayanın bekleme süresini ilişkilendirmek mümkündür.
Karar Verme Desteği
Günümüzde kuruluşların finans, pazarlama, operasyonlar ve diğer birçok departmanla ilgili çok sayıda verisi var. Üst düzey karar vericiler, varsayımların ortadan kaldırılmasıyla daha bilinçli kararlar almak için veri analitiği ve veri bilimine daha fazla eğiliyor.
Regresyon Analizinin yardımıyla, büyük veriler, daha doğru karar verme yolunu açan eylem odaklı yalın bilgiler için sıkıştırılabilir. Regresyon analizi, yöneticileri kaldırmaz veya değiştirmez; bunun yerine, her zamankinden daha etkili ve verimli kararlar almak için ellerine güçlü bir araç verir.
Hata düzeltme
Regresyon Analizi ayrıca işletme yöneticileri için yargılama ve karar vermede sezgisel hataları belirlemeye yardımcı olur.
Örnek olarak, bir mağaza müdürü, yeni personel almaya karar verdiği gece mağazayı açık tutmaya karar verebilir.
Regresyon Analizi, personelin harcamalarını ve gece ürettiği toplam satışları dikkate almanın karşılıklı bir gerekçesi olamayacağını doğru bir şekilde gösterebilir. Böylece, Regresyon Analizinin nicel uygulaması, kötü karar vermeyi ortadan kaldırmayı sağlar.
Eyleme Geçirilebilir Analizler
Şirketler, verilerin değerini ve regresyon analizi teknikleriyle neler başarılabileceğini anlıyor ve kabul ediyor, ancak birçoğu bu verileri eyleme geçirilebilir içgörülere dönüştürmekte başarısız oluyor. Ham verilerden içgörü elde etmek kolay bir iş değildir. Forrester tarafından hazırlanan bir rapor, şirketlerin %74'ünün veri girdileriyle karar vermek istediğini, ancak yalnızca %29'unun verimli kararlar vermelerine olanak tanıyan analitik elde etmeyi başardığını iddia ediyor.
İş dünyasından kritik bir vaka çalışması Konica Minolta'dır. Konica, en başarılı kamera üreticilerinden biriydi. 2000 yılında çoğu fotoğrafçı ve fotoğraf makinesi meraklısı dijital fotoğraf makinelerine yöneldi.
Konica'nın en üst karar alma organı, Konica'nın ilk fotoğraf makinesini piyasaya sürdüğü 2004 yılına gelindiğinde, bunun sonucu olarak, Nikon ve Canon gibi rakiplerin çoğu yeni dijital fotoğraf makinesi pazarında iyi bir yer edinmişti. Sonuç olarak, 2006 yılında şirket o kadar ağır kayıplara uğradı ki, teknolojisinin ve varlıklarının çoğunu Sony'ye sattı.
Konica, regresyon analizi ve benzeri tekniklerle işlenen ham ticari ve piyasa verilerinden içgörülere sahip olsaydı, Konica doğru zamanda doğru kararı verebilirdi.
Eyleme geçirilebilir içgörüler sağlayan veri regresyon analizi, gerçek dünyada oyunun kurallarını değiştirebilecek karar vericilerin eline tam bir güç verir.
Doğru Regresyon Modeli Nasıl Seçilir?
Yüzlerce Regresyon türü vardır ve en popüler türleri ele aldık.
Gerçek dünya çok karmaşıktır ve model yaratıcıları birçok değişkeni ölçer ancak modele yalnızca birkaçını dahil eder. Analistler, bağımlı değişken veya sonuç üzerinde çok az etkisi olan veya hiç etkisi olmayan bağımsız değişkenleri hariç tutar.
Bir regresyon modeli seçerken, regresyon denklemine doğru sayıda bağımsız değişken koyarak dengeyi korumak için aşağıdaki basit gerçek akılda tutulmalıdır.
- Çok az bağımsız değişken, belirtilmemiş model yanlılık haline gelir.
- Çok fazla bağımsız değişken, belirtilmemiş model kesinliğini kaybeder.
- Sadece Doğru model, matematik terimleri önyargılı olmadığında ve en kesin olduğunda yaratılır.
Son düşünceler
Regresyon Analizinin kökenleri yüz yıllık bir bilim olan istatistiklere dayanmaktadır, ancak son zamanlarda büyük verilerin patlamasıyla dikkatleri üzerine çekmeye başlamıştır. Regresyon Analizi, veri analitiği, veri bilimi ve neredeyse tüm organizasyonlardaki uygulamalarında istatistik yoluyla yolunu buluyor.
Regresyon Analizi ile oluşturulan Regresyon Modelleri, öngörülebilirliğin, operasyon verimliliğinin, bilinçli karar vermenin, hataların önlenmesinin, yanlış kararların önlenmesinin ve daha iyi içgörülerin sağlanması için vazgeçilmez bir araçtır.
Diğer Faydalı Kaynak:
İşletmelerde Regresyon Analizinin Önemi
Regresyon Analizi Üzerine Eksiksiz Kılavuz