أنواع مختلفة من تحليل الانحدار يجب معرفتها
نشرت: 2020-03-05تحليل الانحدار هو المنهجية التي تحاول إنشاء علاقة بين متغير تابع ومتغير مستقل واحد أو متعدد.
الانحدار هو مفهوم إحصائي ، لكنه يجد تطبيقاته في العديد من المجالات المتعلقة بالأعمال التجارية مثل التمويل والاستثمار وأسواق الأوراق المالية ، وكذلك في مجالات مثل العلوم والهندسة.
هناك بعض التطبيقات الواعدة لتحليلات الانحدار في شكل علم البيانات ، والتعلم الآلي ، والذكاء الاصطناعي التي تحدد مستقبل البشرية.
- المصطلحات
- أنواع مختلفة من تحليل الانحدار
- ما هو استخدامه؟
- كيفية اختيار النموذج الصحيح
المصطلحات المتعلقة بالانحدار
لفهم أنواع تحليل الانحدار ، من المفيد فهم المصطلحات ذات الصلة.
القيم المتطرفة
القيم المتطرفة مرئية مع مؤامرات البيانات على الرسم البياني. في تحليل الانحدار (1) ، القيم المتطرفة هي نقاط على الرسم البياني تقع بشكل كبير خارج السحابة المكونة من نقاط أخرى. تعتبر النقاط الخارجية ضرورية لأنها يمكن أن تؤثر بشكل كبير على نتيجة تحليل الانحدار. لفهم هذا المفهوم ، لنفترض أن المبنى مليء بالمهنيين ذوي الخلفيات المالية المتوسطة من حيث أرباحهم.
جميعهم يتقاضون رواتب متوسطة تبلغ حوالي مائة ألف دولار في السنة. فجأة ، دخل بيل جيتس وجيف بيزوس المبنى ، وبمجرد إدراج رواتب هذين المليارديرات ، يصبح متوسط الراتب غير دقيق بشكل كبير ، ورواتب هذين السادة المعروفين هي القيم المتطرفة في هذا المثال.
متعدد الخطية
في تحليل الانحدار ، بالنظر إلى الارتباط بين متغيرين أو أكثر من متغيرات الإدخال ، من الملاحظ أنه عند إضافة واحد أو أكثر من متغيرات الإدخال ، يفشل النموذج في جعل الأمور أكثر شفافية حول العالم الحقيقي.
من الأهمية بمكان معرفة كيفية ارتباط متغيرات الإدخال ببعضها البعض. يعد قياس العلاقة الخطية المتعددة لنموذج الانحدار طريقة للعثور على العلاقة بين متغيرات الإدخال ، وكمثال ، قد تصادف نموذجًا ترغب في اكتشافه. ما الذي يحدد راتب الشخص في سن معينة. يتم النظر في المتغيرات (العوامل) المستقلة مثل الخلفية التعليمية والعمر والعديد من العوامل الأخرى التي تؤثر على متوسط الراتب للفرد.
ولكن ، قبل أن تذهب أبعد من ذلك وتلقي بكل عامل تحت الشمس في نموذجك ، عليك أن تعرف كيف يرتبط كل عامل (مشترك). إذا كانت العلاقة الخطية المتعددة عالية جدًا ، فإنها تسبب اضطرابًا في البيانات وينهار النموذج.
تغاير المرونة
تحدث المرونة غير المتجانسة (التي يتم تهجئتها أحيانًا على أنها تغاير المرونة) عندما تكون قراءة الخطأ المعياري للمتغير (SE) المقاس خلال فترة زمنية معينة غير ثابتة.
أي تحليل انحدار يتم تشغيله على مثل هذه البيانات التي تظهر عدم التجانس يعطي ، على الأقل ، معاملات متحيزة ويدمر النتائج.
تجهيز
التخصيص الزائد في تحليل الانحدار هو الحدوث عندما تبدأ المتغيرات في إظهار أخطاء عشوائية بدلاً من وصف العلاقة بين المتغيرات بكفاءة. ينتج عن التجهيز الزائد الكثير من الضوضاء بدلاً من التمثيل الحقيقي للسكان. لم تعد نتيجة النموذج واقعية بعد الآن ، فأنت بحاجة إلى جعل نموذجك أقرب ما يكون إلى الواقع ، كمثال على التجهيز من العالم الحقيقي. أفضل كلمة ممكنة تصف التجهيز من مثال العالم الحقيقي هي "الإفراط في التعميم". عندما يتزايد الخطأ أو التحيز ، لا يمكن تحديد القيم الواقعية كنتيجة.
غير مناسب
يحدث التقليل من الملاءمة عندما يكون عدد المتغيرات نادرًا ما يناسب نموذجًا معينًا ، ولا يظل الناتج دقيقًا. للحصول على نتائج ناجحة من تحليل الانحدار ، فأنت بحاجة إلى القيم المثلى للمتغيرات ، وبالتالي فإن النموذج الذي تم الحصول عليه قريب من الواقع ، باختصار ، عندما لا يتم تحسين المتغيرات ، أو لا يتناسب النموذج مع البيانات بكفاءة ، يطلق عليه الملابس الداخلية.
أنواع تحليل الانحدار
هناك نوعان من المتغيرات في أي شكل من أشكال الانحدار. واحد هو المتغيرات المستقلة ، أو أنها تسمى أيضًا المتغيرات التوضيحية ، يتم استخدامها للمدخلات. النوع الآخر من المتغيرات هو متغير تابع ، يُعرف أيضًا باسم المتنبئ. إنها القيمة التي تحاول اكتشافها أو نتيجة النموذج.
فيما يلي وصف للأنواع المختلفة لتحليل الانحدار.
الانحدارالخطي
يتعامل الانحدار الخطي مع نوعين من المتغيرات. أحد المتغيرات يسمى المتغير المستقل ، والنوع الآخر هو المتغير التابع.
يختلف المتغير المستقل على طول المحور x للمستوى الديكارتي ، ويختلف المتغير التابع على طول المحور y. هذه المتغيرات هي "x" و "y" على التوالي. تعتمد قيمة y على x. عندما تتغير x ، يزيد "y" أو ينقص.
هناك نوعان من الانحدار الخطي.- الانحدار الخطي البسيط
- الانحدار الخطي المتعدد
- الانحدار الخطي البسيط: في الانحدار الخطي البسيط ، لا يوجد سوى متغير تابع واحد ومتغير تابع واحد.
معادلة الانحدار الخطي البسيط هي y = β_0 + β_1 x هنا ، x تمثل المتغير المستقل ، وهي ميل خط الانحدار ، وتقاطع y. "y" هو المتغير التابع أو النتيجة.
- الانحدار الخطي المتعدد: في الانحدار الخطي المتعدد ، يكون المتغير التابع واحدًا ، لكن لديك عدة متغيرات مستقلة.
المعادلة التالية تمثل الانحدار الخطي المتعدد ، y = β_0 + β_1 x_1 + ⋯ β_n x_n + هنا ، y هو المتغير التابع ، هو تقاطع y. تشير إلى المتغيرات المستقلة المتعددة في النموذج. هو "التحيز" أو "الخطأ". إن تقليل التحيز أو الخطأ هو هدفنا الأساسي من أجل إنشاء نموذج قريب من الوضع الواقعي.
الانحدار متعدد المتغيرات
يختلف الانحدار متعدد المتغيرات عن الانحدار الخطي المتعدد بمعنى أنه يحتوي على متغيرات متعددة تابعة مع إدخال متغيرات مستقلة متعددة. المتغيرات التابعة (y_1 ، y_2 ، y_3…. y_n) في صيغ مختلفة. وله أكثر من متغير مستقل (x_1 ، x_2 ، ... .x_m) للتنبؤ بـ Ys. في الانحدار متعدد المتغيرات ، تكون البيانات المستخدمة في الغالب من نفس النوع كما هو الحال في الأنواع الأخرى من تحليل الانحدار.
الانحدار اللوجستي
يعد الانحدار اللوجستي ثاني أكثر أشكال الانحدار شيوعًا بعد الانحدار الخطي ، وتمتد استخداماته إلى الإحصاء الحيوي والطب والعلوم الاجتماعية.
يتعامل الانحدار اللوجستي مع القيم المنطقية مثل ،- صحيحة أو خاطئة
- نعم أو لا
- كبير أو صغير
- واحد أو صفر
يُستخدم الانحدار اللوجستي في تصنيف الكائنات مثل البريد الإلكتروني باعتباره "بريدًا عشوائيًا" أو "ليس بريدًا عشوائيًا".
باختصار ، هناك ناتج واحد في الانحدار اللوجستي يمكن أن يكون إما "صحيح" أو "خطأ". علاوة على ذلك ، يمكن أن يكون هناك مدخل واحد أو مدخلات متعددة في نماذج الانحدار اللوجستي.
الانحدار متعدد الحدود
هناك حالات يتعين علينا فيها التعامل مع المتغيرات التي تكون علاقتها غير خطية. في مثل هذه الحالة ، يكون نموذجنا منحنى وليس خطًا على عكس الانحدار الخطي. وبالتالي ، لدينا شكل آخر من أشكال الانحدار يعرف باسم الانحدار متعدد الحدود.
معادلة الانحدار متعدد الحدود هي القوى الصاعدة لمتغير الإدخال x ، وتعميمها أدناه.
y = β_0 + β_1 x + 〖β〗 _2 x ^ 2 + 〖β〗 _3 〖x〗 ^ 3 + ⋯ β_n x ^ n + ε
الانحدار الكمي
يختلف تعريف الانحدار الكمي اختلافًا كبيرًا عما هو عليه في الممارسة. الكم هو اسم آخر للوسيط في الإحصاء.
الكمية هي النقطة أو الخط الذي يقسم بيانات الإخراج إلى جزأين متساويين. تخيل بعض مجموعة البيانات في شكل خط على المحور ص. مجموعة البيانات مقسمة بالضبط إلى قطعتين متساويتين. تكون قيمة الميول 0.5 أو 50٪ عند نقطة الانقسام.
في نفس الملاحظة ، يتم تقسيم قطعتين متساويتين من البيانات بالتساوي مرة أخرى على طول المحور ص. هذه المرة قسمنا البيانات إلى أربعة أجزاء متساوية ، ونقاط الانقسام الجديدة عند المحور الصادي السفلي للرسم البياني هي 0.25 أو 25٪.
وبالمثل ، فإن مقدار الانقسام العلوي للمحور الصادي هو 0.75 أو 75٪. بشكل عام ، تعتبر الكميات مجرد خطوط أو نقاط تقسم البيانات إلى أجزاء أو مجموعات متساوية.
الكميات تبصق البيانات في مائة مجموعة متساوية الحجم. لكن في العالم الحقيقي ، يكون تعريف القيمة الكمية أكثر مرونة.
يكون الانحدار الكمي مفيدًا عندما يكون هناك تغايرية عالية في النموذج ، ولا يكون الانحدار الخطي دقيقًا بما يكفي للتنبؤ بالنتيجة لأن النموذج الخطي يعتمد على القيم المتوسطة ويمكن أن تكون الكميات أكثر دقة مع القيم المتوسطة.
انحدار ريدج
يستخدم انحدار التلال تقنية تسمى "التنظيم". يعد التنظيم مناسبًا للنماذج التي تفشل في اختبار البيانات ولكنها تمرر بيانات التدريب.
يعمل انحدار ريدج بشكل أفضل عندما تكون معظم المتغيرات في النموذج مفيدة.
عندما تُظهر بيانات العينة علاقة خطية متداخلة متعددة ، يحدث شيئان غير مرغوب فيهما ،
- تعطي تقديرات المربعات الصغرى لمعاملات متغيرات التوقع أخطاء عالية.
- هناك تضخم في الأخطاء المعيارية.
انحدار ريدج هو تقنية لتثبيت معاملات الانحدار في ظل وجود علاقة خطية متعددة.
انحدار لاسو
يرمز Lasso إلى "أقل عامل تحديد للانكماش المطلق." يحقق Lasso Regression أفضل أداء عندما يكون لديك الكثير من المتغيرات عديمة الفائدة. انحدار لاسو يشبه انحدار ريدج ، لكن بعض الاختلافات تجعله فريدًا.
يحتوي كل من Ridge Regression و Lasso Regression على تطبيقات لنفس السيناريوهات التي توجد فيها العلاقات الخطية المتعددة. ومع ذلك ، فإن Ridge Regression مناسب للتنبؤات طويلة المدى.
يطبق انحدار Lasso الانكماش على البيانات. تصبح قيم البيانات تتقلص باتجاه نقطة مركزية مثل الوسيط أو المتوسط.
إن تبسيط نماذج البيانات وتناثرها هما الوظيفتان اللتان يحقق فيهما انحدار اللاسو أفضل أداء. بمعنى آخر ، يجب أن تحتوي نماذج البيانات على المعلمات المثلى لنتائج دقيقة.
انحدار المكون الرئيسي (PCR)
يحتوي تحليل المكون الرئيسي على تطبيق للمتغير x ، مما يقلل من أبعاد البيانات. يتضمن استخراج مجموعة البيانات مع معظم الاختلافات في عملية تكرارية.
نظرًا لأن العملية تكرارية حتى تتمكن من تحليل مجموعة بيانات متعددة الأبعاد ، فإن انحدار المكون الرئيسي يتغلب على مشاكل الأبعاد والعلاقة الخطية المتداخلة الموجودة في انحدار المربعات الصغرى العادية.
الانحدار الصافي المرن
يبسط الانحدار الصافي المرن النموذج لسهولة التفسير. يمكن أن يحتوي النموذج على الكثير من المتغيرات (المعروفة أيضًا باسم المعلمات) ؛ يمكن أن يصل عددهم إلى الملايين في نماذج محددة. في مثل هذا النموذج ، لا يمكن تحديد المتغيرات المفيدة والتي لا فائدة منها.
في مثل هذه الحالة ، لا تعرف أي نوع من الانحدار تختار من Ridge Regression و Lasso regression. هنا ، يأتي دور Elastic Net Regression لتبسيط النموذج.
يجمع Elastic-Net Regression بين عقوبة Ridge Regression وعقوبة Lasso Regression ويوفر أفضل ما في العالمين. كما أنه يعمل بشكل أفضل مع المتغيرات المرتبطة.
المربعات الصغرى الجزئية (PLS)
تعتبر المربعات الصغرى الجزئية كلاً من المتغيرات التفسيرية والتابعة. المبدأ الأساسي لهذا النوع من الانحدار هو أن متغيري x و y يمرون بالتحلل إلى هياكل كامنة في عملية تكرارية.
PLS يمكن أن تتعامل مع العلاقات الخطية المتعددة. يأخذ في الاعتبار هياكل البيانات المتعلقة بـ x و y ، مما يوفر لك نتائج مرئية متقنة لتفسير البيانات. يمكن أن تؤخذ عدة متغيرات في الاعتبار.
دعم الانحدار المتجه
يعد Support Vector Regression (SVR) خوارزمية تعمل مع وظيفة مستمرة. إنه على النقيض من Support Vector Machine بهذا المعنى ، فإن Support Vector Machine (SVM) تتعامل مع مشاكل التصنيف. يتنبأ SVR بالمتغيرات المرتبة المستمرة.
في الانحدار البسيط ، يجب أن يكون التركيز على تقليل الخطأ إلى أدنى حد بينما يكتشف Support Vector Regression عتبة الخطأ.
الانحدار الترتيبي
يتعامل الانحدار اللوجستي مع فئتين ، ولكن في الانحدار الترتيبي (المعروف أيضًا باسم الانحدار اللوجيستي الترتيبي) ، تلعب ثلاث فئات أو أكثر مع افتراض وجود طلب لا لبس فيه.
يساعد الانحدار الترتيبي على التنبؤ بمتغير تابع ترتيبي عند وجود واحد أو أكثر من المتغيرات المستقلة.
انحدار بواسون
في Poisson Regression ، يعد العدد أو المعدل الذي يحدث عنده الحدث هو نقطة التركيز الرئيسية.
نقيس المعدل الذي يحدث عنده حدث في انحدار بواسون. بمعنى آخر ، نقوم بنمذجة عدد مرات وقوع الحدث (العد) بمرور الوقت. في Poisson Regression ، الوقت ثابت ، ونقيس عدد الحدث.
الانحدار السلبي ذي الحدين
من المفيد نمذجة مجموعة البيانات (العدد) المنفصلة. في نفس الملاحظة ، يساعد الانحدار السلبي ذي الحدين عندما يكون للبيانات تباين أعلى مقارنة بالمتوسط الذي يكون تشتت البيانات أكثر من اللازم عند رسمها.
لا يفترض النموذج ذو الحدين السالب أن المتغير يساوي المتوسط كما يصنعه النموذج المعتمد على انحدار بواسون.
شبه الانحدار بواسون
انحدار شبه بواسون هو تعميم لانحدار بواسون. كما ذكرنا سابقًا ، يتوقف نموذج انحدار بواسون على افتراض غير عادل عادةً بأن التباين يساوي المتوسط.
يتم تشغيل نموذج Quasi Poisson عندما يكون التباين هو الوظيفة الخطية للمتوسط ، وهو أيضًا أعلى من المتوسط. إنه السيناريو الذي يكون فيه Quasi Poisson أكثر ملاءمة للتطبيق.
انحدار كوكس
يتحقق Cox Regression (المعروف أيضًا باسم انحدار المخاطر النسبية) من تأثيرات العديد من المتغيرات خلال المدة الزمنية التي يستغرقها حدث معين لحدوثه.
ضع في اعتبارك الأحداث التالية حيث يمكن العثور على انحدار كوكس مفيد ،
- الوقت المستغرق لنوبة قلبية ثانية بعد النوبة القلبية الأولى.
- الوقت الذي استغرقه وقوع الحادث الثاني بعد الحادث الأول.
- الوقت المستغرق بعد الكشف عن السرطان حتى الموت.
تعد بيانات الوقت إلى الحدث أمرًا حيويًا لتطبيق انحدار كوكس.
انحدار طوبيا
يكون انحدار Tobit مفيدًا في تقدير العلاقة الخطية عندما توجد الرقابة في المتغير التابع. الرقابة هي مراقبة جميع المتغيرات المستقلة. الحساب الفعلي لقيمة المتغير التابع موجود فقط في نطاق محدود من الملاحظات.
الانحدار البايزي
يعتمد الانحدار البايزي على توزيع الاحتمالات بدلاً من تقدير النقطة. نتيجة لذلك ، الناتج أو "ص" ليس قيمة واحدة. إنه توزيع احتمالي. كما نعلم أن التوزيع الاحتمالي دالة رياضية وليست قيمة. يعطي توزيع الاحتمالية النتائج المحتملة في التجربة.
عندما نؤلف صيغة نموذج الانحدار الخطي بناءً على توزيع الاحتمالات ، نحصل على التعبير التالي.
ذ ˜ N (β ^ TX ، σ ^ 2 أنا)- الناتج (ص) محسوب من توزيع غاوسي عادي اعتمادًا على المتوسط والتباين.
- يتم الحصول على تبديل (T) لمصفوفة الوزن (β) بضربها بمصفوفة التوقع (X).
- التباين هو مربع الانحراف المعياري (σ ^ 2) مضروبًا في مصفوفة الهوية (I).
(الصياغة متعددة الأبعاد للنموذج قيد الدراسة)
الانحدار الأقل انحرافًا مطلقًا (LAD)
يعد الانحراف الأقل مطلقًا هو البديل الأكثر شهرة لطريقة المربعات الأقل لتحليل النماذج الخطية. نحن نعلم أنه في طريقة المربعات الصغرى ، نقوم بتقليل مجموع الأخطاء التربيعية ، ولكن في LAD ، نقوم بتقليل مجموع القيم المطلقة للأخطاء. يحاول العثور على دالة تناسب مجموعة من البيانات بشكل وثيق.
في الحالة التي تكون فيها بياناتنا بسيطة ، يكون الانحراف المطلق الأقل خطًا مستقيمًا في المستوى الديكارتي ثنائي الأبعاد.
إن صياغة "الأقل مطلقًا" سهلة الفهم. لنفترض أن مجموعة البيانات الخاصة بنا تتكون من نقطتين متغيرتين ((x_i، y_i) و i = 1،2،3،4،5 ....... n.
هدفنا هو إيجاد دالة f تساوي تقريبًا (~) كما هو موضح أدناه.
و (x_i) ~ y_i
الادعاء هو أن الوظيفة f ذات شكل معين يحتوي على بعض المعلمات التي نحتاج إلى حسابها. النقطة التي يجب ملاحظتها هنا هي أن الوظيفة f يمكن أن تحتوي على عدد I من معاملات x (أو المتغيرات المستقلة أو المتغيرات التوضيحية).
سنحاول معرفة قيم المعلمات التي ستقلل من المجموع التالي للقيم المطلقة للأخطاء (أو القيم المتبقية).
S = ∑_ (i = 1) ^ n▒ 〖| y_i〗 -f (x_ (i))الانحدار البيئي
يعد الانحدار البيئي مفيدًا في الغالب في مواضيع مثل العلوم السياسية والتاريخ. تسمح لنا هذه التقنية بأخذ التهم على المستوى الكلي والتوصل إلى تنبؤات على المستوى الجزئي.
يمكن أن يحدد الانحدار البيئي السلوك الانتخابي للأفراد بين مختلف الفصائل ومجموعات المجتمعات. يعتمد التقدير على البيانات التي تم جمعها من الحسابات السابقة.
تستند البيانات البيئية إلى التهم في منطقة أو مجموعات أو كائنات معينة أو بمرور الوقت. باختصار ، تساعدنا البيانات الإجمالية على التعرف على السلوك المحصور على الأفراد.
ما هو تحليل الانحدار المستخدم؟
يعد تحليل الانحدار مفيدًا في الحصول على العديد من أهداف العمل.
التحليل التنبئي
أحد أبرز التطبيقات هو التحليل التنبئي الذي يسمح بالتنبؤ بأحداث عمل معينة بشكل أكثر دقة. أحد أنواع التحليل التنبئي هو "تحليل الطلب" ، والذي يقيس الزيادة في مبيعات المنتج. يمكن وضع نجاح منتج تم إطلاقه حديثًا ، بالإضافة إلى المنتجات الجارية ، بشكل صحيح في السوق.
كمثال آخر ، تحليل الانحدار له تطبيقات في الإعلان عن المنتجات والخدمات. من المتوقع باستخدام تحليل الانحدار أن عدد المتسوقين المحتمل أن يصادفوا إعلانًا. يساعد المتخصصين في المبيعات والتسويق على تحديد قيمة العطاء للمواد الترويجية.
يعد تحليل الانحدار أيضًا أداة مفيدة لشركات التأمين. تستخدمه شركات التأمين لمعرفة ائتمان حاملي وثائق التأمين وتقدير عدد المطالبات التي يحتمل تقديمها من عملائهم.
كفاءة العملية
تتخذ المنظمات قرارات جادة باستخدام تحليل الانحدار لتحسين عملياتها.
يمكن للقرارات المستندة إلى البيانات استبعاد القرارات المشكوك فيها والتخمين غير الدقيق مع المشاعر الغريزية وسياسات الشركة.
التحليل الانحداري هو تحويل فن الإدارة إلى علم. على سبيل المثال ، من الممكن ربط وقت انتظار المتصل بعدد الشكاوى في مركز الاتصال أو قسم رعاية العملاء.
دعم اتخاذ القرار
تمتلك المنظمات اليوم الكثير من البيانات المتعلقة بالتمويل والتسويق والعمليات والعديد من الأقسام الأخرى. يميل كبار صانعي القرار أكثر نحو تحليلات البيانات وعلوم البيانات لاتخاذ قرارات أكثر استنارة مع التخلص من التخمين.
بمساعدة تحليل الانحدار ، يمكن أن تخضع البيانات الضخمة للضغط للحصول على معلومات بسيطة عملية المنحى تفتح الطريق لاتخاذ قرارات أكثر دقة. لا يؤدي تحليل الانحدار إلى إزالة المديرين أو استبدالهم ؛ بدلاً من ذلك ، يضع في أيديهم أداة فعالة لاتخاذ قرارات أكثر تأثيرًا وفعالية من أي وقت مضى.
تصحيح الاخطاء
يساعد تحليل الانحدار أيضًا في تحديد الأخطاء البديهية في الحكم واتخاذ القرار لمديري الأعمال.
على سبيل المثال ، قد يقرر مدير المتجر إبقاء المتجر مفتوحًا في الليل الذي يقرر تعيين موظفين جدد من أجله.
يمكن أن يشير تحليل الانحدار بدقة إلى أن النظر في نفقات الموظفين وإجمالي المبيعات التي يولدها في الليل لا يمكن أن يكون له مبرر متبادل. وبالتالي ، فإن التطبيق الكمي لتحليل الانحدار يمكّن من استبعاد اتخاذ القرارات السيئة.
رؤى قابلة للتنفيذ
تدرك الشركات وتقر بقيمة البيانات وما يمكن تحقيقه من خلال تقنيات تحليل الانحدار ، لكن العديد منها يفشل في تحويل هذه البيانات إلى رؤى قابلة للتنفيذ. إن الحصول على رؤى من البيانات الأولية ليس بالمهمة السهلة. يزعم تقرير صادر عن Forrester أن 74٪ من الشركات تريد اتخاذ قرار بشأن مدخلات البيانات ، لكن 29٪ فقط تنجح في الحصول على تحليلات يمكن أن تسمح لها باتخاذ قرارات مثمرة.
دراسة حالة واحدة مهمة من عالم الأعمال هي كونيكا مينولتا. كانت Konica واحدة من أنجح الشركات المصنعة للكاميرات. في عام 2000 ، تحول معظم المصورين وعشاق الكاميرا إلى الكاميرات الرقمية.
لم تتخذ هيئة اتخاذ القرار العليا في كونيكا قرارات بالسرعة الكافية نتيجة لذلك بحلول عام 2004 عندما أطلقت كونيكا أول كاميرا لها ، كان معظم المنافسين مثل نيكون وكانون قد رسخوا أنفسهم جيدًا في سوق الكاميرات الرقمية الجديدة. نتيجة لذلك ، في عام 2006 ، عانت الشركة من خسائر فادحة قامت ببيع الكثير من تقنياتها وأصولها لشركة Sony.
إذا كان لدى Konica الرؤى المستمدة من البيانات التجارية والسوق الخام التي تمت معالجتها من خلال تحليل الانحدار والتقنيات المماثلة ، لكانت Konica قادرة على اتخاذ القرار الصحيح في الوقت المناسب.
يوفر تحليل انحدار البيانات رؤى قابلة للتنفيذ يضع القوة المطلقة في أيدي صانعي القرار الذين يمكن أن يغيروا قواعد اللعبة في العالم الحقيقي.
كيف تختار نموذج الانحدار الصحيح؟
هناك المئات من أنواع الانحدارات ، وقد قمنا بتغطية الأنواع الأكثر شيوعًا.
العالم الحقيقي معقد للغاية ، ويقيس منشئو النموذج العديد من المتغيرات لكنهم يدرجون القليل منها فقط في النموذج. يستبعد المحللون المتغيرات المستقلة التي لها تأثير ضئيل جدًا أو معدوم على المتغير التابع أو النتيجة.
عند اختيار نموذج الانحدار ، يجب مراعاة الحقيقة البسيطة التالية للحفاظ على التوازن من خلال وضع العدد الصحيح من المتغيرات المستقلة في معادلة الانحدار.
- عدد قليل جدًا من المتغيرات المستقلة ، يصبح النموذج غير المحدد متحيزًا.
- العديد من المتغيرات المستقلة ، يفقد النموذج غير المحدد دقته.
- يتم إنشاء النموذج الصحيح فقط عندما تكون مصطلحات الرياضيات غير متحيزة وتكون أكثر دقة.
افكار اخيرة
تعود أصول تحليل الانحدار إلى الإحصائيات التي تعود إلى مائة عام ، لكنها اكتسبت مؤخرًا بؤرة الاهتمام مع انفجار البيانات الضخمة. يجد تحليل الانحدار طريقه من خلال الإحصائيات في تحليلات البيانات وعلوم البيانات وتطبيقاتها في جميع المؤسسات تقريبًا.
تعد نماذج الانحدار التي تم إنشاؤها باستخدام تحليل الانحدار أداة لا غنى عنها لتوفير القدرة على التنبؤ وكفاءة التشغيل واتخاذ القرارات المستنيرة ومنع الخطأ وتجنب القرارات الخاطئة ورؤى أفضل.
مصادر أخرى مفيدة:
أهمية تحليل الانحدار في الأعمال
الدليل الكامل لتحليل الانحدار