نسيج البيانات مقابل شبكة البيانات: الفرق
نشرت: 2022-03-14في البحث عن تطوير أفضل بنية بيانات لمتطلبات المنظمة الحالية والمستقبلية ، هناك العديد من الخيارات التي يمكن للمؤسسات البحث عنها. نظرًا لتعبئة بنية البرنامج للبرنامج ، فإن هذه الخيارات كثيرة للمؤسسات للاختيار من بينها. قد تجد الشركات صعوبة في تحديد الخيار الصحيح ، وهذا هو السبب في ظهور أنماط من الذروة مؤخرًا ، مما يسمح للمؤسسات بمساعدتها في رحلة إدارة البيانات ، والتي تشمل أقمشة البيانات وشبكات البيانات.
في المقام الأول ، يعكس كل من نسيج البيانات وقاعدة البيانات التشابه من وجهة نظر مفاهيمية. عادة ما تكون الشبكات مصنوعة من الأقمشة ويمكن إعطاؤها أشكالًا مختلفة حسب المتطلبات. يتيح ذلك لأقسام تكنولوجيا المعلومات وضع هذه الشبكات فوق الأنظمة الأخرى ، والتي تعمل باستمرار في عملية طحن البيانات.
بغض النظر عن مدى تشابه هاتين المقاربتين ، هناك بعض الاختلافات المميزة ، والتي لا يمكن ملاحظتها إلا إذا تعمقنا أكثر في هذين النهجين.
ما هو نسيج البيانات
جاء التعريف الأول لنسيج البيانات في منتصف القرن العشرين ، حيث كان نويل يوهانا ، المحلل من شركة Forrester ، أول فرد يقوم بذلك. من وجهة نظر المفهوم ، يعتبر نسيج البيانات طريقة قائمة على البيانات الوصفية لتوصيل مجموعة متنوعة من أدوات البيانات. الهدف هو معالجة نقاط الضعف الرئيسية في بعض مشاريع البيانات الضخمة ، ليس فقط بطريقة متماسكة ولكن أيضًا تعمل في نموذج الخدمة الذاتية. هناك العديد من الإمكانات التي تقدمها حلول نسيج البيانات ، مثل الوصول إلى البيانات ، والاكتشاف ، والتحول ، والتكامل ، والحوكمة ، والنسب ، والأمان.
هناك وتيرة كبيرة تم بناؤها في مفهوم نسيج البيانات. يساعد هذا في تبسيط عملية الوصول إلى البيانات وإدارتها في بيئة غير متجانسة متنامية. تشتمل البيئة غير المتجانسة على مخازن البيانات الخاصة بالمعاملات والتشغيل ، وبحيرات البيانات ، ومستودعات البيانات ، ومنازل البحيرة. نحن نشهد عددًا متزايدًا من المؤسسات التي تعمل على تطوير صوامع البيانات ، وبسبب الحوسبة السحابية ، فإن المشكلة المتعلقة بتنويع البيانات تزداد اتساعًا.
من خلال وضع نسيج بيانات واحد أعلى مستودعات البيانات ، يمكن للمؤسسة تجميعها في شكل إدارة موحدة لمصادر البيانات المختلفة ، والتي تشمل مستهلكي البيانات النهائية مثل علماء البيانات ومهندسي البيانات ومحللي البيانات. ومع ذلك ، ما يجب ملاحظته هو أن إدارة البيانات موحدة وليست التخزين الفعلي. التخزين الفعلي لا يزال في نموذج موزع. هناك العديد من البائعين مثل Informatica و Talend الذين يوفرون نسيجًا للبيانات بالإمكانيات الموضحة أعلاه.
ما هي شبكة البيانات
بينما تحل شبكة البيانات معظم المشكلات التي يقوم بها نسيج البيانات ، مثل التحدي المتمثل في إدارة البيانات في بيئة غير متجانسة. ومع ذلك ، تختلف طريقة معالجة هذه المشكلة وحلها في نهج شبكة البيانات. بينما ينشئ نسيج البيانات طبقة واحدة من الإدارة الافتراضية أعلى تخزين البيانات الذي يضم البيانات الموزعة ، فإن نهج شبكة البيانات يتعلق أكثر بمجموعة موزعة من الفرق التي ستدير البيانات وفقًا للمتطلبات على الرغم من وجود بعض بروتوكولات الحوكمة.
تم تعريف مفهوم شبكة البيانات بواسطة Zhamak Dehgani. Zhamak هو مدير حضانة التكنولوجيا في Thoughtworks بأمريكا الشمالية. المبدأ الأساسي الذي يحكم نهج شبكة البيانات في حل عدم التوافق بين بحيرة البيانات ومستودع البيانات. تم تصميم مستودع بيانات الجيل الأول لتخزين كميات هائلة من البيانات المنظمة ، والتي يستهلكها محللو البيانات بشكل أساسي.
ومع ذلك ، تُستخدم بحيرة بيانات الجيل الثاني لتخزين كميات هائلة من البيانات غير المهيكلة ، والتي تُستخدم في الغالب لبناء نماذج التعلم الآلي التنبؤية. في هذا التعريف ، أوضح Zhamak حول مستودع بيانات من الجيل الثالث (يُعرف باسم Kappa) ، والذي يدور حول تدفقات البيانات في الوقت الفعلي من خلال اعتماد الخدمات السحابية. ومع ذلك ، فإن هذا لا يحل الفجوة بين أنظمة الجيل الأول والثاني من وجهة نظر الاستخدام.
في عملية ضمان مزامنة البيانات ، تقوم العديد من الشركات بتطوير وصيانة خط أنابيب بيانات ETL شامل. ونتيجة لذلك ، فإن هذا يخلق حاجة لمهندسي بيانات متخصصين للغاية لديهم الكفاءة للحفاظ على عمل هذه الأنظمة.
كانت النقطة الحاسمة التي طرحها Zhamak حول المشكلة المتمثلة في أن تحويل البيانات لا يمكن ربطه بالبيانات من قبل المهندسين. على العكس من ذلك ، يجب أن يكون شيئًا مثل عامل التصفية الذي يتم تطبيقه على مجموعة مشتركة من البيانات ، والتي تكون متاحة لجميع المستخدمين.
لذلك ، بدلاً من تطوير خط أنابيب معقد لبيانات ETL ، يتم تخزين البيانات في شكلها الأصلي. يتم أخذ ملكية البيانات من قبل فريق يتألف من خبراء المجال. تتكون بنية نهج شبكة البيانات الجديدة التي أوضحها Zhamak من الخصائص التالية:
- الملكية القائمة على المجال للبيانات والهندسة اللامركزية
- البيانات كمنتج
- يتم تقديم منصة البنية التحتية للبيانات في نموذج الخدمة الذاتية
- الحوكمة الحاسوبية الموحدة
باختصار ، يحدد نهج شبكة البيانات أن بحيرات البيانات فقط هي التي تمتلك المرونة وقابلية التوسع للتعامل مع متطلبات التحليلات.
شبكة البيانات مقابل نسيج البيانات
كما لاحظنا أعلاه ، هناك عدد غير قليل من أوجه التشابه بين شبكة البيانات ونهج نسيج البيانات. ومع ذلك ، دعونا ننظر أيضًا في الاختلافات بين الاثنين.
وفقًا لـ Noel Yuhanna ، المحلل من Forrester ، فإن الاختلاف الرئيسي بين شبكة البيانات ونهج نسيج البيانات هو الطريقة التي تتم بها معالجة واجهات برمجة التطبيقات.
تعتمد شبكة البيانات بشكل أساسي على واجهة برمجة التطبيقات للمطورين ، في حين أن نسيج البيانات ليس كذلك. نسيج البيانات هو في الأساس عكس شبكة البيانات ، حيث سيقوم المطورون بكتابة التعليمات البرمجية لواجهات برمجة التطبيقات إلى واجهة التطبيق. على عكس شبكة البيانات ، فإن نسيج البيانات هو طريقة بدون رمز أو رمز منخفض ، حيث يتم تنفيذ تكامل API في النسيج دون الاستفادة منه بشكل مباشر.
وفقًا لمحلل آخر ، جيمس سيرا ، الذي يعمل مع Ernst & Young كمهندس بيانات ضخمة وتخزين البيانات ، فإن الاختلاف بين شبكة البيانات ونسيج البيانات يكمن في نوع المستخدمين الذين يصلون إليها.
توفر شبكة البيانات ونسيج البيانات إمكانية الوصول إلى البيانات عبر التقنيات والأنظمة الأساسية المختلفة. الفرق هو أن نسيج البيانات أكثر تركيزًا على التكنولوجيا بينما شبكة البيانات تعتمد بشكل أكبر على التغيير التنظيمي.
وفقًا لمحلل Eckerson Group ، David Wells ، يمكن لأي مؤسسة استخدام شبكة البيانات ونسيج البيانات وحتى مركز البيانات معًا. يضيف ويلز كذلك أن هذين المفهومين ليسا منفصلين تقنيًا.
يتم تطوير منتجات نسيج البيانات بشكل أساسي على أنماط استخدام الإنتاج ، بينما تم تصميم منتجات شبكة البيانات بواسطة مجالات الأعمال. يعد اكتشاف البيانات الوصفية مستمرًا ، والتحليل عملية مستمرة في حالة نسيج البيانات ، بينما في حالة شبكة البيانات ، تعمل البيانات الوصفية في مجال أعمال محلي وتكون ثابتة بطبيعتها.
من وجهة نظر النشر ، يقوم نسيج البيانات بتسخير مرفق البنية التحتية الحالي المتاح ، بينما تقوم شبكة البيانات باستقراء البنية التحتية الحالية بعمليات النشر الجديدة في مجالات الأعمال.
تجد كل من شبكة البيانات وأنسجة البيانات مكانًا في غرفة اجتماعات مجالس إدارة البيانات الضخمة. عندما يتعلق الأمر بالعثور على إطار عمل معماري مناسب أو بنية معمارية.
مصادر أخرى مفيدة:
5 خطوات لخلق ثقافة قائمة على البيانات | TechFunnel
ما هي تحليلات البيانات الضخمة؟ دليل للمبتدئين | Techfunnel
لماذا تعتبر الثقافة القائمة على البيانات أمرًا بالغ الأهمية للتحول الرقمي
التنقيب في البيانات - كل ما تحتاج إلى معرفته | Techfunnel