본문 바로가기

자격증공부/데이터분석준전문가(ADsP)

[ADsP] (3과목) 데이터 분석 - 통계분석 Part2 요약 1. 회귀분석과 로지스틱 회귀분석 ㅇ 회귀분석 : 하나 이상의 연속형 독립변수들이 연속형 종속변수에 얼마나 영향을 끼치는지 수치적으로 파악하는 통계기법 - 반응변수(종속변수)/설명변수(독립변수) - 회귀계수의 추정 : 최소제곡법, 최소자승법 ㅇ 로지스틱 회귀분석 : 하나 이상의 연속형 독립변수들인 이산형(범주형) 종속변수에 얼마나 영향을 끼치는지 수치적으로 파악하는 통계기법 2. 회귀분석의 종류 ㅇ 단순회귀 : 1개의 독립변수와 반응변수가 직선(선형) 관계 ㅇ 다중회귀 : 2개 이상의 독립변수와 반응변수의 직선(선형) 관계 ㅇ 다항회귀 : 2개 이상의 독립변수와 반응변수가 2차 함수 이상의 관계 ㅇ 비선형 회귀 : 회귀식이 미지의 모수들과 선형관계가 아닌 경우 (ex. 지수함수,로그함수, 삼각함수 등) .. 더보기
[ADsP] (3과목) 데이터 분석 - 통계분석 Part1 기출문제 1. 아래 보기에 들어갈 A와 B를 바르게 고른 것은 무엇인가? 두 개의 사건에 대하여 두 사건이 서로 공통 부분이 존재하지 않는 경우를 ( A )관계라 하며, 두 개의 사건이 공통인 부분이 존재한다 하더라도 서로가 서로에게 영향을 주지 않는 경우를 ( B )관계에 있다고 한다. A B ① 독립 상관 ② 배반 독립 ③ 배반 상관 ④ 상관 배반 ※ 정답 : 2번 2. 표본조사를 실시하기 위한 표본 추출 방법의 선택은 중요한 과제다. 다음 보기에서 설명하는 표본 추출방법은 무엇인가? 모집단의 구성비율을 반영한 표본집단을 생성하기 위해 모집단을 여러 개의 이질적인 집단으로 나눈 뒤 모집단의 비율과 같은 비율로 각 군집으로부터 표본을 추출하는 방법이다. ① 집락 추출법 ② 비례 층화 추출법 ③ 계통 추출법 ④ .. 더보기
[ADsP] (3과목) 데이터 분석 - 통계분석 Part1 요약 1. 통계와 통계분석 ㅇ 통계 : 분석하고자 하는 집단에 대해 조사하거나 실험을 통해 자료의 요약된 형태의 데이터를 추출, 불확실한 상황에서 효과적인 의사결정을 할 수 있도록 수치자료를 수집하고 분석하는 학문 ㅇ 통계분석 : 목적에 맞게 특정 대상으로부터 데이터를 획득하고, 적절한 통계기법을 활용해 의사결정을 하는 과정 2. 전수조사와 표본조사 ㅇ 전수조사 : 통계 분석을 수행하기 위해 조사 대상이 되는 자료 모두에 대해 데이터 수집을 실시 (ex. 대한민국 성인 남성의 평균키를 조사할 때 2천만명 모두를 조사) ㅇ 표본조사 : 통계분석을 수행하기 위해 조사 대상이 되는 자료의 일부분에 대하여 데이터 수집 실시 (ex. 대한민국 성인 남성 평균키 조사 시 현실적으로 2천만명을 대상으로 전수조사는 불가능하.. 더보기
[ADsP] (3과목) 데이터 분석 - 데이터 전처리 기출문제 1. 다음 중 여러 곳에 흩어진 데이터를 수집한 뒤 기업의 의사결정을 위해 공통의 형식으로 변환된 데이터의 집합으로써 특정 목적을 달성하기 위해 추출된 작은 데이터 집합은 무엇인가? ① 데이터베이스 ② 데이터 마트 ③ 데이터 레이크 ④ 데이터 웨어하우스 ※ 정답 : 2번 - 데이터레이크는 목적을 가지고 있지 않은 모든 데이터가 자유롭게 저장된 저장소 - 데이터웨어하우스는 형식을 가지고 데이터가 저장됨 2. 다음 보기에서 설명하는 패키지는 무엇인가? 데이터프레임을 하나 이상의 특정 변수를 기준으로 나누는 함수와 나누어진 데이터를 원하는 구성으로 재결합하는 함수를 제공하며, 유연한 데이터 재구성 및 총계 처리가 가능하도록 도와준다. 대표적인 함수로는 melt와 cast가 있다. ① reshape ② sqld.. 더보기
[ADsP] (3과목) 데이터 분석 - 데이터 전처리 요약 1. 데이터 웨어하우스(DW)와 데이터마트(DM) ㅇ 데이터 웨어하우스 : 여러 데이터베이스(RDB, 클라우드, NoSQL 등)로부터 공통의 형식으로 변환되어 사용자의 의사결정에 도움이 되기 위한 일시적인 데이터 집합 ㅇ 데이터 마트 : 특정한 목적 달성을 위해 활용하는 소규모의 데이터웨어하우스 ㅇ 신규 시스템이나 DW에 포함되지 못한 자료의 경우 기존 Legacy시스템이나 스테이징 영역(기존 Legacy에서 임시로 저장된 데이터) 과 ODS(Operational Data Store)에서 데이터를 가져와서 DW에서 가져온 내용과 결합하여 활용할 수 있다. - 운영시스템(Legacy)에 직접 접근해서 데이터를 활용하는 것은 매우 위험한 일이므로 거의 이루어 지지 않고, 가급적 클링징 영역인 ODX에서 데이.. 더보기
[ADsP] (2과목) 데이터분석 기획 - 분석마스터 플랜 기출문제 1. 다음 중 분석 마스터 플랜 수립에서 과제 우선순위 결정과 관련한 내용으로 부적절한 것은? ① ROI 관점에서 투자비용 요소의 3V와 비즈니스 요소의 1V를 활용하여 우선순위를 결정한다. ② 분석 과제 우선순위 결정에 고려할 사항에는 전략적 중요도, ROI, 실행 용이성이 있다. ③ 적용 기술의 안전성 검증요소는 투자 용이성의 평가이다. ④ 전략적 중요도는 전략적 필요성과 시급성의 두 가지 요소로 선별한다. ※ 정답 : 3번 – 기술용이성을 평가하는 것 2. 아래 포트폴리오 사분면에서 시급성을 중시할 때 분석과제 우선순위로 바르게 연결된 것은? ① Ⅲ→Ⅳ→Ⅱ ② Ⅲ→Ⅰ→Ⅱ ③ Ⅰ→Ⅱ→Ⅲ ④ Ⅱ→Ⅳ→Ⅰ ※ 정답 : 1번 3. 다음 중 ROI 관점에서의 과제 우선순위 평가에 대해 잘못 설명하고 있는 것은.. 더보기
[ADsP] (2과목) 데이터분석 기획 - 분석마스터 플랜 요약 1. 분석마스터 플랜 ㅇ 하나의 프로젝트를 수행하기 위한 전체 설계도이며, 분석 프로젝트의 체계적인 관리와 더불어 역량 내재화를 통해 중장기적 관점에서 지속적으로 문제를 해결하는 것으로 목표로 함 ㅇ 분석 마스터 플랜은 분석 대상이 되는 과제를 도출하고, 우선순위를 평가하여 단기적인 세부 이행 계획과 중장기적인 로드맵을 작성 ㅇ 분석 로드맵의 과제들이 잘 수행되도록 하기 위해서는 분석 거버넌스 체계 수립이 필요하다. 분석 거버넌스 역량을 높이기 위해 현재 분석 수준이 어떤지 살펴보는 분석 성숙도 측정이 필요하다. 2. 분석 마스터 플랜 수립 프레임워크 ㅇ 발굴된 분석 과제에 대한 우선순위 결정 : 전략적 중요도, 비즈니스 성과, ROI, 실행용이성 ㅇ 발굴된 분석 과제의 적용 범위와 방식을 결정 후 이행.. 더보기
[ADsP] (2과목) 데이터분석 기획 - 데이터분석 기획 Part2 기출문제 1. 다음 중 상향식 접근법에 대한 설명으로 부적절한 것은 무엇인가? ① 문제가 불명확한 경우 무엇을 분석해야 할지 찾기 위한 접근법이다. ② 프로토타이핑 접근법은 상향식 접근법 중 하나이다. ③ 비즈니스 모델 기반 문제 탐색 시 고객, 업무, 제품, 지원 인프라, 규제 및 감사의 5가지 블록 관점에서 문제를 탐색한다. ④ 무엇을 어떻게 분석해야 할지 모르는 ‘발견’에서 ‘통찰’로 넘어가는 Buttom Up 수행 방법이다. ※ 정답 : 3번 – 하향식 접근법의 1단계 문제탐색 방법 2. 다음 중 지도학습의 예시로 부적절한 것은 무엇인가? ① 강아지사진 100장과 고양이 사진 100장을 통해 규칙을 찾고 새로운 사진이 고양이인지 강아지인지 판별 ② 고객별 장바구니 속 구매 아이템으로부터 새로운 규칙을 발견.. 더보기