본문 바로가기

데이터전처리

[ADsP] (3과목) 데이터 분석 - 데이터 전처리 기출문제 1. 다음 중 여러 곳에 흩어진 데이터를 수집한 뒤 기업의 의사결정을 위해 공통의 형식으로 변환된 데이터의 집합으로써 특정 목적을 달성하기 위해 추출된 작은 데이터 집합은 무엇인가? ① 데이터베이스 ② 데이터 마트 ③ 데이터 레이크 ④ 데이터 웨어하우스 ※ 정답 : 2번 - 데이터레이크는 목적을 가지고 있지 않은 모든 데이터가 자유롭게 저장된 저장소 - 데이터웨어하우스는 형식을 가지고 데이터가 저장됨 2. 다음 보기에서 설명하는 패키지는 무엇인가? 데이터프레임을 하나 이상의 특정 변수를 기준으로 나누는 함수와 나누어진 데이터를 원하는 구성으로 재결합하는 함수를 제공하며, 유연한 데이터 재구성 및 총계 처리가 가능하도록 도와준다. 대표적인 함수로는 melt와 cast가 있다. ① reshape ② sqld.. 더보기
[ADsP] (3과목) 데이터 분석 - 데이터 전처리 요약 1. 데이터 웨어하우스(DW)와 데이터마트(DM) ㅇ 데이터 웨어하우스 : 여러 데이터베이스(RDB, 클라우드, NoSQL 등)로부터 공통의 형식으로 변환되어 사용자의 의사결정에 도움이 되기 위한 일시적인 데이터 집합 ㅇ 데이터 마트 : 특정한 목적 달성을 위해 활용하는 소규모의 데이터웨어하우스 ㅇ 신규 시스템이나 DW에 포함되지 못한 자료의 경우 기존 Legacy시스템이나 스테이징 영역(기존 Legacy에서 임시로 저장된 데이터) 과 ODS(Operational Data Store)에서 데이터를 가져와서 DW에서 가져온 내용과 결합하여 활용할 수 있다. - 운영시스템(Legacy)에 직접 접근해서 데이터를 활용하는 것은 매우 위험한 일이므로 거의 이루어 지지 않고, 가급적 클링징 영역인 ODX에서 데이.. 더보기