-
Data 저장 및 운용 방식 용어 정리Data Engineering 2023. 7. 7. 09:32반응형
Data Lake: 데이터 레이크는 구조화되지 않은 원시 데이터부터 반구조화 및 구조화된 데이터에 이르기까지 모든 유형의 데이터를 저장할 수 있는 시스템입니다. 데이터 레이크는 대용량의 원시 데이터를 그대로 저장하며, 이는 데이터 웨어하우스와는 대조적으로 필요에 따라 데이터를 쿼리하고 분석할 수 있게 해줍니다.
Operational Data Store (ODS): ODS는 다른 데이터베이스에서 추출된 현재의 트랜잭션 데이터를 중간 저장소에 보관하는 시스템입니다. ODS는 일반적으로 실시간의 비즈니스 활동을 분석하는 데 사용됩니다.
CDW (Corporate Data Warehouse): CDW는 조직의 전체 데이터를 통합적으로 관리하고 보관하는 중앙 데이터 저장소입니다. 이는 분석, 보고서 작성, 의사결정 등을 지원하는데 필요한 구조화된 데이터를 포함하며, 일반적으로 ETL(추출, 변환, 로드) 과정을 통해 데이터가 적재됩니다.
Data Warehouse: 데이터 웨어하우스는 조직의 여러 시스템과 데이터베이스에서 추출된 구조화된 데이터를 보관하는 시스템입니다. 이는 데이터를 일관된 형식으로 통합, 정리하며, 기업의 의사결정 과정을 지원하는데 사용됩니다. 일반적으로 데이터 웨어하우스는 시간에 따른 트렌드 분석, 보고서 생성 등의 목적으로 사용됩니다.
Data Mart: 데이터 마트는 특정 부서 또는 사용자 그룹이 특정 주제에 초점을 맞춰 접근할 수 있도록 설계된 데이터 웨어하우스의 하위 집합입니다. 데이터 마트는 일반적으로 데이터 웨어하우스에서 데이터를 추출하여, 그룹의 특정 요구에 맞게 데이터를 구성하고 제공합니다.Data Hub: 데이터 허브는 다양한 데이터 원본으로부터 데이터를 수집, 변환, 조합하는 중앙 집중식 플랫폼입니다. 데이터 허브는 통합된 데이터 접근과 관리를 제공하며, 데이터 웨어하우스나 데이터 레이크와 비슷하지만 각각의 원본에서 데이터를 동기화하고 일관성을 유지하는 것에 더 중점을 둡니다.
Data Vault: 데이터 볼트는 하이브리드 데이터 모델링 방법론을 사용하는 장기 데이터 저장 시스템입니다. 이는 데이터 웨어하우스의 형태를 취하며, 비즈니스와 기술적인 변경에 더 잘 대응할 수 있도록 설계되어 있습니다.
Federated Database Systems: 연합 데이터베이스 시스템은 논리적으로 통합된 데이터베이스를 형성하며, 여러 독립적인 데이터베이스를 가로 질러 쿼리를 수행할 수 있습니다. 이 시스템은 각 데이터베이스의 독립성을 유지하면서도 통합된 사용자 인터페이스를 제공합니다.반응형'Data Engineering' 카테고리의 다른 글
Digdag 설치하기 (workflow) (0) 2022.05.27 Workflow Engine Digdag 소개 및 Local 설치 (0) 2021.08.10 데이터의 이동을 쉽게 해보자! Embulk 사용하기 (Test용 DB설치 포함, postgresql) (0) 2021.05.21