Data Fabric คืออะไร?
เผยแพร่แล้ว: 2022-02-14มีการระบุว่า data fabric เป็นองค์ประกอบที่ต้องมีสำหรับทุกองค์กรที่เน้นข้อมูลเป็นศูนย์กลาง ในช่วงไม่กี่ปีที่ผ่านมา คำศัพท์นี้ค่อนข้างเกี่ยวข้องกับการจัดการข้อมูลขององค์กรและการรวมข้อมูลขององค์กร บริษัทวิเคราะห์ Gartner ระบุว่า data fabric ถือเป็น 10 อันดับแรกของข้อมูลและแนวโน้มการวิเคราะห์สำหรับปี 2021 Gartner ยังคาดการณ์ด้วยว่าภายในปี 2024 เกือบ 25% ของผู้จำหน่ายการจัดการข้อมูลทุกรายจะให้บริการโซลูชัน data fabric ที่ครอบคลุม นี่จะเป็นการก้าวกระโดดครั้งใหญ่จากการมีส่วนร่วมในปัจจุบันที่ 5%
- คำจำกัดความของ Data Fabric
- ความต้องการของ data fabric
- สถาปัตยกรรม
- ความสามารถที่สำคัญ
- การเปรียบเทียบ
- กรณีการใช้งานของ Data Fabric
- ข้อดีของ Data Fabric
ผ้าข้อมูลคืออะไร?
พูดง่ายๆ ก็คือ data fabric เป็นสถาปัตยกรรมที่เรียบง่าย เป็นหนึ่งเดียว และเป็นหนึ่งเดียว ที่รวมชุดเทคโนโลยีและบริการที่ผสานรวมเข้าด้วยกัน คอลเลกชันนี้สร้างขึ้นเพื่อส่งมอบข้อมูลที่ผสานรวมและสมบูรณ์โดยใช้วิธีการที่ถูกต้อง ให้กับลูกค้าข้อมูลที่ถูกต้องและในเวลาที่ถูกต้อง กล่าวถึงทั้งงานปฏิบัติการและงานวิเคราะห์
โครงสร้างข้อมูลประกอบด้วยเทคโนโลยีการจัดการข้อมูลที่สำคัญ เช่น – แค็ตตาล็อกข้อมูล การกำกับดูแลข้อมูล การรวมข้อมูล การวางท่อข้อมูล และการประสานข้อมูล
ที่มา: Gartner Inc. และ/หรือบริษัทในเครือ
ทำไมคุณถึงต้องการ data fabric?
เหตุผลพื้นฐานที่องค์กรต้องการ data fabric คือมันให้บริการตัวขับเคลื่อนการจัดตำแหน่งจำนวนมากที่มีลักษณะเป็นธุรกิจ ด้านเทคนิค และองค์กร
ตัวขับเคลื่อนธุรกิจ
- สำหรับผู้ขับเคลื่อนธุรกิจ data fabric ช่วยลดเวลาในการเข้าถึงข้อมูลเชิงลึกและช่วยในกระบวนการตัดสินใจอย่างชาญฉลาดได้เร็วขึ้น ซึ่งทำได้โดยการวางท่อข้อมูลลงในคลังข้อมูลและ Data Lake อย่างรวดเร็ว
- Data Fabric ยังช่วยในการแสดงมุมมอง 360 องศาแบบเรียลไทม์ของทุกแง่มุมของเอนทิตีธุรกิจ เช่น ลูกค้า ผู้ขาย คำสั่งซื้อ การส่งมอบ ผลิตภัณฑ์ ฯลฯ
ตัวขับเคลื่อนองค์กร
- Data Fabric ทำหน้าที่เป็นภาษากลางระหว่างวิศวกรข้อมูลและผู้บริโภคข้อมูล ซึ่งช่วยปรับปรุงการทำงานร่วมกันระหว่างทีมธุรกิจและทีมข้อมูล
- มีความสามารถในการเข้าถึงข้อมูลแบบบริการตนเองที่ช่วยให้ผู้บริโภคได้รับข้อมูลที่ต้องการและในเวลาใดก็ตาม
ไดรเวอร์การจัดการข้อมูล
- การจัดการการเตรียมข้อมูลช่วยให้นักวิทยาศาสตร์ข้อมูลและทรัพยากรไอทีอื่นๆ หลีกเลี่ยงการทำงานซ้ำๆ ใดๆ เกี่ยวกับการเสริมแต่งข้อมูล การแปลง และการล้างข้อมูล
- ผ่าน data fabric เราสามารถเข้าถึงข้อมูลทั่วทั้งองค์กรทุกประเภทโดยใช้วิธีการใดก็ได้ ซึ่งรวมถึงการย้ายข้อมูลจำนวนมาก การจำลองข้อมูลเสมือนจริง และแม้แต่ API
- Data Fabric ยังปรับปรุงและรวมเครื่องมือการจัดการข้อมูลปัจจุบันที่ใช้ในองค์กร และเพิ่มประสิทธิภาพเครื่องมือที่ซ้ำซ้อนอื่นๆ เพื่อปรับปรุงความคุ้มค่า
สถาปัตยกรรมของ Data Fabric
สถาปัตยกรรม data fabric ที่มีการกำหนดไว้อย่างดีนั้นเป็นแบบโมดูลาร์และสนับสนุนการปรับใช้ขนาดใหญ่ที่สามารถเป็นได้ทั้งแบบมัลติคลาวด์ ในองค์กร หรือแม้แต่การปรับใช้แบบไฮบริด สำหรับสถาปัตยกรรม data Fabric แหล่งข้อมูลมีตั้งแต่ระบบเดิมจำนวนมากที่ทำงานในไซโลไปจนถึงสภาพแวดล้อมคลาวด์ล่าสุด
ไดอะแกรมต่อไปนี้ให้แนวคิดเกี่ยวกับสถาปัตยกรรมของ data fabric
ที่มา: Gartner Inc. และ/หรือบริษัทในเครือ
ผู้บริโภคของ data fabric ประกอบด้วยนักวิทยาศาสตร์ข้อมูลและนักวิเคราะห์ นักวิเคราะห์การตลาด นักวิเคราะห์การขาย และทรัพยากรที่ทำงานเกี่ยวกับความเป็นส่วนตัวของข้อมูลพร้อมกับสถาปนิกระบบคลาวด์
ความสามารถหลักของ data fabric
ต่อไปนี้เป็นชุดของความสามารถหลักที่ data fabric รองรับเมื่อรวมเข้ากับแพลตฟอร์มเดียว:
- แคตตาล็อกข้อมูล
เพื่อจัดหมวดหมู่ จัดประเภท และใส่สินทรัพย์ข้อมูลลงในโครงสร้างสินค้าคงคลังที่เหมาะสม จึงนำเสนอเป็นภาพ
- วิศวกรรมข้อมูล
เพื่อพัฒนาไปป์ไลน์ข้อมูลที่เชื่อถือได้เพื่อวัตถุประสงค์ในการวิเคราะห์และการปฏิบัติงาน
- การกำกับดูแลข้อมูล
เพื่อให้มั่นใจในคุณภาพของข้อมูลและสอดคล้องกับระเบียบข้อบังคับและโปรโตคอลเกี่ยวกับความเป็นส่วนตัวของข้อมูล ความปลอดภัยของข้อมูล และความสามารถในการปรับขนาด
- การเตรียมข้อมูล
นี่เป็นการกำหนดกระบวนการของการไหลของข้อมูล ซึ่งรวมถึงขั้นตอนที่เกี่ยวข้องกับการล้างข้อมูล การทำให้สมบูรณ์ การแปลง และการตรวจสอบข้อมูล
- การรวมข้อมูลและการส่งมอบข้อมูล
สิ่งนี้เกี่ยวข้องกับการดึงหรือดึงข้อมูลจากแหล่งที่เชื่อถือได้ และทำให้ผู้ใช้ข้อมูลพร้อมใช้งานสำหรับการประมวลผลต่อไป ทำได้ผ่าน API, ETL เป็นต้น
เหนือและเหนือความสามารถหลักตามที่กล่าวไว้ข้างต้น มีความสามารถที่ไม่ใช่คอร์บางอย่างเช่นกัน ซึ่งแฟบริกข้อมูลนำมาสู่ตาราง
เหล่านี้มีดังนี้:
- มาตราส่วน ปริมาณ และประสิทธิภาพของข้อมูล
- การเข้าถึง
- การกระจาย
- ความปลอดภัย
การเปรียบเทียบระหว่าง Data Fabric/Data Lake/Database for Operational Workloads
เพื่อช่วยให้คุณเข้าใจถึงความสำคัญของ data fabric ให้เราดูการเปรียบเทียบข้อดีและข้อเสียของแหล่งข้อมูลต่างๆ
แหล่งข้อมูลต่างๆ | ข้อดี | ข้อเสีย |
---|---|---|
Data Lake, Data Warehouse | รองรับการสืบค้นข้อมูลในข้อมูลที่มีโครงสร้างและไม่มีโครงสร้างจำนวนมาก | ไม่เหมาะสำหรับการค้นหาข้อมูลรายการเดียวที่ทำให้เกิดการตอบสนองช้า ไม่รองรับข้อมูลสด ดังนั้นการอัปเดตข้อมูลอย่างต่อเนื่องจึงไม่น่าเชื่อถือ |
ไม่มีฐานข้อมูล SQL | รองรับการปรับขนาดเชิงเส้นผ่านสถาปัตยกรรมคลังข้อมูลแบบกระจาย | ไม่รองรับ SQL ดังนั้นจึงต้องใช้ทักษะเฉพาะทาง |
ผ้าข้อมูล | • รองรับ SQL อย่างสมบูรณ์ • รองรับการปรับขนาดเชิงเส้นผ่านสถาปัตยกรรม datastore แบบกระจาย • รองรับการทำงานพร้อมกันสูงพร้อมประสิทธิภาพแบบเรียลไทม์ • รองรับการสืบค้นที่ซับซ้อนสำหรับหน่วยงานธุรกิจเดียว • รองรับวิธีการบูรณาการทุกประเภท • โครงสร้างการกำกับดูแลข้อมูลที่ยืดหยุ่นและเป็นพลวัต | NA |
แม้ว่า data fabric จะทำหน้าที่เป็นเทคโนโลยีที่เหนือกว่าสำหรับปริมาณงานในการปฏิบัติงานในระดับสูง แต่ก็เป็นโซลูชันที่ทำหน้าที่เป็นเทคโนโลยีซึ่งกันและกันใน data Lake และคลังข้อมูล สำหรับปริมาณงานข้อมูลดังกล่าว โครงสร้างข้อมูลสามารถ:
1. ส่งข้อมูลที่สดใหม่และเชื่อถือได้มาสู่พวกเขา เพื่อวัตถุประสงค์ในการวิเคราะห์ออฟไลน์
2. รับข้อมูลเชิงลึกทางธุรกิจจากพวกเขา เพื่อฝังลงในกรณีการใช้งานในการปฏิบัติงานแบบเรียลไทม์
กรณีการใช้งานของ Data Fabric
ในการดำเนินงานระดับองค์กร มีกรณีการใช้งานหลายกรณีที่ต้องการสถาปัตยกรรมข้อมูลระดับสูงและความเร็วสูงที่สามารถรองรับธุรกรรมหลายรายการได้ ตัวอย่างเหล่านี้ได้แก่:
ให้มุมมองลูกค้า 360 องศา
นำเสนอมุมมองของลูกค้าแบบครอบคลุมและเป็นหนึ่งเดียวผ่านระบบ CRM, IVR หรือพอร์ทัลแบบบริการตนเองของลูกค้า
ปฏิบัติตามกฎหมายความเป็นส่วนตัวของข้อมูล
โดยการนำเวิร์กโฟลว์ที่ยืดหยุ่นมาใช้และโซลูชันระบบอัตโนมัติของข้อมูลซึ่งสอดคล้องกับการปฏิบัติตามข้อกำหนดระหว่างบุคคล ระบบ และข้อมูล
ทดสอบข้อมูลตามความต้องการ
ช่วยในการสร้างคลังข้อมูลทดสอบและแชร์ข้อมูลการทดสอบแบบไม่เปิดเผยตัวตนไปยังศูนย์ข้อมูลต่างๆ เพื่อรักษาความสมบูรณ์ของข้อมูล
ข้อดีของ Data Fabric
มีข้อดีมากมายของ data fabric เหนือวิธีการจัดการข้อมูลแบบดั้งเดิม/ทางเลือกบางอย่าง
- ปรับปรุงการจัดการข้อมูล
- ขยายบริการข้อมูล
- ความสม่ำเสมอ ความพร้อมใช้งาน และความทนทานระดับสูง
- การรักษาความปลอดภัยที่แน่นหนามาก
- ประสิทธิภาพสูง
ความคิดสุดท้าย
ทีมที่ไม่ต้องการมีโซลูชัน data fabric เดียวสำหรับการวิเคราะห์ข้อมูลและโซลูชันอื่นสำหรับข่าวกรองการปฏิบัติงาน พวกเขามักจะชอบที่จะมีแฟบริคข้อมูลเดียวสำหรับทั้งคู่
แหล่งข้อมูลที่เป็นประโยชน์อื่นๆ:
5 ขั้นตอนในการสร้างวัฒนธรรมที่ขับเคลื่อนด้วยข้อมูล | TechFunnel
เคล็ดลับ 12 ข้อในการสร้างความรู้ข้อมูลในปี 2565 | Techfunnel
Data Hub – ทุกสิ่งที่คุณจำเป็นต้องรู้ | Techfunnel