Data Lake, Data Warehouse, Data Mart 의 구분
데이터 저장소를 일컫는 다양한 용어들이 존재하는데, 이번 글에서는 Data Lake, Data Warehouse, Data Mart 에 대한 개념을 정리해보고자 한다. 1. Data Lake (데이터 레이크) 1.1. 개념 조직 내에서 생성 및 수집되는 모든 데이터를 원본 형태 그대로 저장하는 곳 구조화된 정형 데이터 뿐만 아니라 로그, 이메일, 이미지, 음성, 영상 등과 같은 비정형 데이터를 포함 1.2. 등장 배경 데이터의 활용 계획이 정해지지 않았지만 향후 활용 가능성을 위해 데이터를 보관하려는 목적으로 활용됨 비슷한 맥락에서 데이터 과학자들은 정제되지 않은 원본 데이터 자체를 이해하고, 분석 목적에 맞게 가공하고 싶은 니즈가 있음 (데이터의 정제 과정에서 정보의 손실이 발생함) 2. Data Wa..
2022.06.22