데이터 웨어하우징의 이점과 당면 과제
게시 됨: 2020-03-26데이터 웨어하우스란 무엇입니까?
데이터 웨어하우스는 다양한 소스의 데이터가 비즈니스 결정을 내리기 위한 실용적인 데이터 통찰력으로 이어지는 분석을 준수하는 비즈니스 리소스입니다.
즉, 데이터 웨어하우스는 적시에 중요한 비즈니스 결정을 내리는 "비즈니스 인텔리전스 시스템"의 핵심입니다.
무엇보다도 이것은 모든 데이터가 안전하고 안전하게 저장되는 중앙 집중식 공간입니다. 보고서, 데이터 분석 및 기타 다양한 쿼리를 생성하는 데 유용합니다. 또한 회사 데이터베이스에서 데이터 스트림을 추출하고 의미 있는 통찰력으로 전환하는 데 도움이 됩니다. 또한 일반 데이터 웨어하우스는 저장소로 사용됩니다. 그것은 현대적인 접근 방식이며 매우 잘 작동합니다.
- 데이터 웨어하우스의 장점과 단점
- 데이터 웨어하우스를 구축해야 하는 이유
- 데이터 웨어하우스의 비용 편익 분석
- 데이터 웨어하우스와 데이터 웨어하우스의 차이점 데이터 레이크 대 데이터마트
데이터 웨어하우스의 장점
- 데이터 웨어하우스는 적시에 올바른 결정을 내리기 때문에 더 높은 ROI(투자 수익률)를 가져옵니다.
- 데이터 전문가와 관리자는 핵심 성과 지표(KPI)를 찾아내는 비즈니스 분석을 통해 보다 정확한 시장 예측을 할 수 있으므로 핵심 인력이 보다 나은 계획을 수립할 수 있습니다.
- 데이터 웨어하우스에는 더 정확한 예측과 결과를 허용하는 다양한 기간의 상태 분석과 다양한 추세를 나타낼 수 있는 방대한 과거 데이터 저장소가 있습니다.
- 데이터에서 정보를 얻을 수 있기 때문에 보다 비용 효율적인 결정을 내릴 수 있습니다.
- 고객 서비스 품질은 데이터 웨어하우스의 정보 분석을 통해 정확하게 추적하고 개선할 수 있습니다.
데이터 웨어하우스의 단점
- 데이터 웨어하우스에는 일반적으로 방대한 양의 정적 데이터가 있고 검색 기능이 제한되어 있습니다. 데이터의 일부를 수집하고 스키마를 통해 필터링해야 하며 유용한 형식으로 가져오기까지 며칠이 걸릴 수 있습니다.
- 데이터 웨어하우스는 일반적으로 임시 쿼리의 대상이 되며 데이터가 처리되는 느린 속도를 처리하는 것이 극도로 번거로워 결과를 처리하기가 어렵습니다.
- 데이터 웨어하우스는 일반적으로 상당한 비용/편익 비율을 가지고 있습니다. 하드웨어 및 소프트웨어 인프라와 관련하여 상당한 비용이 든다는 두 가지 주요 이유가 있습니다. 이 문제의 또 다른 주요 단점은 데이터 웨어하우스 인프라의 디지털 기계에 대한 작업으로 서비스에 대해 보상해야 하는 IT 및 기술 직원과 관련된 높은 비용입니다.
- 데이터 웨어하우스는 거의 항상 소프트웨어와 하드웨어 측면에서 상호 운용성 문제로 어려움을 겪고 있습니다. 다른 운영 체제 플랫폼과 다른 호환되지 않는 소프트웨어 플랫폼을 실행 중일 수 있습니다. 같은 맥락에서 서로 다른 유형의 장비가 필사적으로 서로 통신을 시도할 수 있습니다. 데이터 웨어하우스를 유지 관리하는 데 비용이 추가될 수 있습니다.
- 웨어하우스에 저장된 대부분의 데이터는 원시 데이터입니다. 데이터 웨어하우스 내부에는 해결하는 데 시간과 노력을 들일 수 있는 숨겨진 문제가 항상 있습니다. 그러나 일반적으로 사용 빈도와 데이터 웨어하우스의 크기에 따라 몇 개월, 때로는 몇 년 동안 탐지되지 않은 채로 남아 있습니다.
- 필수 데이터가 소스 시스템에서 결정적으로 필요할 수 있는 캡처되지 않은 상태로 남아 있는 경우 데이터 검색 노력의 경우가 있을 수 있습니다. 데이터 웨어하우스에 정보가 손실될 가능성이 있습니다.
- 데이터 웨어하우스의 일부 데이터는 많은 양의 데이터가 유사한 데이터를 가질 수 있는 데이터 균질화의 대상이 될 수 있으며 데이터를 검색하는 사람에게 혼란을 주거나 다른 심각한 오해를 유발할 수 있습니다.
- 데이터 웨어하우스에서는 여러 시스템이 통합을 거치고 예상대로 작동하지 않을 때 항상 통합 문제가 발생합니다. 그들이 전혀 작동하지 않을 때 상황은 더욱 악화될 수 있습니다.
( 백서 다운로드: Hadoop을 사용하여 엔터프라이즈 데이터 웨어하우스를 최적화하는 방법)
데이터 웨어하우스를 구축해야 하는 이유는 무엇입니까?
데이터 웨어하우스에 투자해야 하는 이유는 많습니다. 첫 번째는 비즈니스 프로세스와 디지털 기술의 통합을 개선하는 데 도움이 된다는 것입니다. 또한 공급업체, 고객, 비즈니스 운영 및 귀하에게 가장 중요한 비즈니스의 기타 중요한 구성 요소와 관련된 다양한 메트릭 및 관찰에 대한 훌륭한 통찰력을 제공합니다.
또한 응답 시간을 향상시키고 변경 사항을 기록할 수 있고 데이터 품질을 높일 수 있습니다. 정보를 훨씬 더 빠르게 활용할 수 있으며 그로 인해 다양한 이점도 얻을 수 있습니다. 그리고 상황을 더욱 개선하기 위해 운영 시스템의 부담을 덜고 데이터 품질을 높이며 매번 뛰어난 전문성과 훌륭한 경험을 전달할 것입니다.
( 또한 읽기: 빅 데이터 분석을 둘러싼 큰 헛소리 )
데이터 웨어하우스 비용 편익 분석은 무엇을 의미합니까?
데이터 웨어하우스 비용-편익 분석을 수행할 때 처리하고 있는 비용을 평가하고 가치가 있는지 여부를 확인해야 합니다. 첫째, 전문가 수준에서 데이터 웨어하우스를 획득하고 구성하는 것으로 구성된 설정 비용이 있습니다. 그런 다음 매우 비용이 많이 들 수 있는 데이터 마이그레이션과 같은 사항을 고려해야 합니다.
또한 스토리지 및 컴퓨팅 용량, 관리 비용 및 데이터 유지 관리와 같은 추가 비용이 있습니다. 프로세스와 경험 자체를 더 잘 이해하는 데 도움이 되기 때문에 이러한 것들이 얼마나 비쌀 수 있는지 이해하는 것이 중요합니다.
데이터 웨어하우스와 데이터 레이크, 데이터 마트의 비교
데이터웨어 하우스
반면 데이터 웨어하우스는 이미 구조화된 데이터만 저장합니다. 다목적 솔루션이며 탁월한 결과와 경험을 제공하는 동시에 지표 및 연구 정보에 액세스할 수 있는 탁월한 방법을 제공합니다. 다양한 데이터 유형을 지원할 수 있습니다. 매우 쉽게 데이터를 분석하고 유지 관리할 수 있습니다.
데이터 레이크
데이터 레이크는 생성된 양식의 모든 데이터를 추가하는 최신 버전입니다. 방대한 양의 데이터를 저장할 수 있습니다. 스토리지 솔루션에 가깝습니다. 그 모든 데이터로 무엇을 할 것인지 걱정할 필요가 없습니다. 그러나 곧 있을 이유로 저장하고 있습니다.
데이터 마트
데이터 마트는 데이터 웨어하우스의 하위 섹션입니다. 일반적으로 데이터 마트를 사용하여 특정 부서에 대한 데이터를 저장합니다. 보시다시피 각 옵션에는 장단점이 있으며 요구 사항에 맞는 올바른 옵션을 찾아야 합니다.
다음 표는 데이터 저장소 유형에 대한 추가 정보를 제공합니다.
데이터웨어 하우스 | 데이터 레이크 | 데이터마트 |
---|---|---|
데이터는 구조화되어 있으며 관계형 데이터의 원칙을 따릅니다. | 데이터는 구조화되거나 구조화되지 않으며 센서, 웹사이트, 비즈니스 앱, 소셜 미디어, 모바일 앱 등과 같은 다양한 소스에서 얻습니다. | 특정 응용 프로그램의 하위 집합인 관계형 데이터입니다. 데이터는 주로 데이터 웨어하우스 및 다양한 외부 리소스에서 캡처할 수 있습니다. |
데이터 스키마는 비정규화되며 이는 쓰기 시 스키마입니다. | 스키마가 비정규화되고 schema-on-read입니다. | 데이터 마트에서 스키마는 정규화되거나 비정규화될 수 있습니다. |
여기에는 여러 소스의 과거 데이터가 포함되어 있습니다. | 데이터는 기본 형식으로 존재하며 데이터 전문가가 통찰력을 조작하고 도출할 수 있는 전례 없는 유연성을 제공합니다. | 특정 응용 프로그램에 쉽고 빠르게 액세스할 수 있습니다. |
데이터는 중앙 집중식 위치에 존재하며 비즈니스 인텔리전스 및 분석에서 사용할 준비가 되어 있습니다. | 데이터는 원시 상태로 존재하며 큐레이션에 사용 가능하거나 사용 불가능할 수 있습니다. | 데이터는 고도로 선별됩니다. |
데이터 웨어하우스의 이점에 대해 자주 묻는 질문
Q. 기존 데이터 웨어하우스와 비교하여 활성 데이터 웨어하우스의 주요 이점은 무엇입니까?
A. 주요 차이점은 전송 속도입니다. 활성 데이터 웨어하우스는 기존 데이터 웨어하우스의 전송 속도가 느린 반면 데이터 전송 속도가 빠릅니다.
마지막 생각들
비즈니스 환경에 데이터 웨어하우스를 채택하기 전에 데이터 팀이 다음과 같은 몇 가지 관행을 따르도록 사전에 보장해야 합니다.
- 데이터의 일관성, 정확성 및 무결성을 계획합니다.
- 데이터는 잘 정의되고 타임스탬프가 있어야 합니다.
- 데이터 과학자와 분석가에게 적합한 도구를 제공하십시오.
- 데이터 충돌에 대처할 준비를 하십시오.
- 운영 체제와 보고서가 동시에 실행되는지 확인하십시오. 즉, 대체하지 않습니다.
- 데이터 수명 주기를 준수합니다.
- 모든 이해 관계자가 데이터 웨어하우스 구현 절차에 참여하는지 확인합니다.
데이터 웨어하우스는 여러 전문가와 기업 경영진이 매일 전반적인 삶에 영향을 미칠 수 있는 중요한 비즈니스 결정에 사용합니다. 데이터 웨어하우스는 비즈니스를 한 단계 끌어올릴 수 있는 경제성과 매력적인 투자 수익은 말할 것도 없고 유익하고 편리할 수 있습니다.
기타 유용한 리소스:
SaaS 비즈니스를 시작하는 데 필요한 주요 핵심 도구
데이터 과학자를 위한 최고의 데이터 과학 도구