본문 바로가기

전체 글

[경영빅데이터분석사] 경영빅데이터분석사 자격증 시험정보 [자격증 소개] ㅇ 소개 - 빅데이터 경영 업무에 필요한 이론과 실무능력을 검증하는 자격시험제도입니다. 경영 빅데이터 분석사 시험의 기본 목적은 빅데이터 분석 전문가를 양성하려는데 있습니다. 빅데이터 분석 전문가란 빅데이터 이해 및 처리 기술에 대한 기본지식을 바탕으로 빅데이터 분석 기획, 빅데이터 분석, 빅데이터 시각화 업무를 수행하고 이를 통해 프로세스 혁신 및 마케팅 전략 결정 등의 과학적 의사결정을 지원하는 직무를 수행하는 전문가를 말합니다. ㅇ 주관 : 민각 자격으로 한국경제신문, 씨에스랩(주) 공동발급 [필요성] 폭증하는 데이터가 경제적 자산이 되고 가치창출의 원천이 되는 빅데이터 시대에 도래하였습니다. 기업은 치열한 경쟁환경에서 영향력이 강해진 고객을 만족시키기 위하여 고객의 행동 맥락과 감.. 더보기
[ADsP] (3과목) 데이터분석 - 군집분석과 연관분석 기출문제 1. 군집분석을 실시하기 위한 여러 거리 측도 중 범주형 데이터 거리를 계산하기 위한 측도는 무엇인가? ① 유클리디안 거리 ② 자카드 거리 ③ 맨하튼 거리 ④ 표준화 거리 ※ 정답 : 2번 2. 아래의 표를 보고 두 데이터 A와 B의 맨하튼 거리와 체비셰프 거리를 바르게 구한 것은? 맨하튼 거리 체비셰프 거리 ① 9 29 ② 4 29 ③ 9 4 ④ 4 4 ※ 정답 : 3번 - 맨하튼 : 차이 값들의 합 =2+3+4 = 9 - 체비셰프 : 최대값인 4 3. 다음 중 계층적 군집분석에 대한 설명으로 부적절한 것은 무엇인가? ① 범주형 데이터에서도 거리 측정이 가능하므로 분석 기법을 적용할 수 있다. ② R에서 최장연결법으로 수행하기 위해서는 complete를 사용한다. ③ 최장연결법은 가장 거리가 먼 데이터.. 더보기
[ADsP] (3과목) 데이터 분석 - 군집분석과 연관분석 요약 1.개요 ㅇ 비지도 학습 중 하나로 여러 변수로 표현된 데이터들 사이의 유사성을 측정하고 몇 개의 군집으로 나누어 특징을 파악하는 기법. 생물학에서 종의 분류, 마케팅에서의 시장 세분화 및 고객 성향 분석, 추천 시스템을 위한 협업 필터링 등 서비스의 기반을 제공 2. 종류 ㅇ 계층적 군집분석 : 병합적 방법 ㅇ 비계층적 군집분석 : 계층을 보유하지 않음. K평균 군집 3. 거리측도 ㅇ 연속형 변수 - 유클리디안 거리 : 두 점 사이의 거리를 계산하는 대표적인 방법으로 통계적 개념이 포함되지 않아 변수들의 산포 정도를 고려하지 않음 (가장 가까운 거리) - 맨하튼 거리 : 시가거리라고도 하며 도시에서 최단 거리를 구하듯 각 변수들의 차이의 단순 합으로 계산한 거리 - 체비셰프 거리 : 변수간 거리 차이 .. 더보기
[ADsP] (3과목) 데이터 분석 - 데이터마이닝, 분류분석 기출문제 1. 다음 중 대용량 데이터 속에서 숨겨진 지식 또는 새로운 규칙을 추출해 내는 과정을 일컫는 것은? ① 지식경영 ② 의사결정지원시스템 ③ 데이터웨어하우징 ④ 데이터마이닝 ※ 정답 : 4번 2. 다음 중 기법의 활용 분야가 나머지와 다른 하나를 고르시오. ① 로지스틱 회귀분석 ② 인공신경망 ③ 의사결정나무 ④ SOM ※ 정답 : 4번 3. 다음 중 나머지와 분석 방법이 다른 것은? ① k-means clustering ② single linkage method ③ DBSCAN ④ 주성분분석 ※ 정답 : 4번 - 1~3번은 군집분석 4. 아래의 데이터 마이닝 분석 예제 중 비지도 학습을 수행해야 하는 예제는? (가) 우편물에 인쇄된 우편번호 판별 분석을 통해 우편물을 자동으로 분류 (나) 고객의 과거 거래.. 더보기
[ADsP] (3과목) 데이터 분석 - 데이터마이닝, 분류분석 요약 1. 개요 방대한 양의 데이터 속에서 숨겨진 규칙, 패턴 등을 찾고 예측 및 의사결정에 활용가능한 가치를 탐색, 이렇게 발견된 규칙 및 패턴을 컴퓨터가 학습하는 것이 기계학습, 심층학습, 강화학습이라 지칭함. (유튜브, 알파고, 넷플릭스 등) ㅇ 종류 : 정형/비정형 데이터 마이닝 ㅇ 통계분석은 가설이나 가정에 따른 분석이나 검증을 하지만, 데이터마이닝은 데이터로부터 의미있는 저보를 찾아내는 방법을 통칭 2. 데이터마이닝 방법에 따른 분류 ㅇ 지도학습 : 정답이 있는 데이터를 활용하여 분석 모델을 구축하는 것 (ex. 회귀분석, 의사결정트리, 인공신경망 모형, 로지스틱회귀분석 등) ㅇ 비지도학습 : 정답이 없는 데이터들 사이의 유사성, 거리를 활용하여 그룹화하거나 규칙을 파악하는 것. (ex. 군집분석,.. 더보기
[ADsP] (3과목) 데이터 분석 - 통계분석 Part3 기출문제 1. 다음 중 상관분석에 대한 설명으로 부적절한 것은 무엇인가? ① 양적척도에 대한 상관분석을 수행하기 위해서는 피어슨 상관계수를 사용해야 한다. ② 상관분석의 귀무가설은 ‘두 변수간 상관관계는 존재하지 않는다.’ 이다. ③ 상관분석을 통해 두 변수의 선형관계 여부를 파악할 수 있다. ④ 서열척도에 대해서 상관계수를 구할 때 동일 석차가 존재하면 분석을 수행할 수 없다. ※ 정답 : 4번 2. 다음 중 다차원 척도법에 대하여 잘못 설명한 것은 무엇인가? ① 데이터를 저차원 공간에 배열하는 시각화 기법 중 하나이다. ② STRESS 값이 0인 경우 적합이 매우 잘 된 것이다. ③ 데이터의 변수는 연속형 변수 또는 서열척도여야 한다. ④ 좌표 평면에 나타내었을 때 x축, y축이 데이터 해석에 도움을 줄 수 .. 더보기
[ADsP] (3과목) 데이터 분석 - 통계분석 Part3 요약 1. 상관분석 ㅇ 상관계수를 활용한 분석방법으로 두 변수간 선형적 관계 존재 유무를 파악하기 위함 ㅇ 상관분서 귀무가설은 ‘두 변수간 상관관계는 존재하지 않는다’ 이다. ㅇ 상관계수 r의 범위는 -1~1이며, 0에 가까울수록 상관이 낮다고 말한다. ㅇ 종류 - 피어슨 상관분석 : 두 변수간 양적 척도인 경우, 두 변수 간의 선형관계의 크기 측정, 상관관계가 존재하지 않는 경우 0이다. - 스피어만 상관분석 : 두 변수가 순서 척도인 경우, 두 변수간의 선형/비선형적 관계 나타낼 수 있음 2. 다차원 척도법 (MDS : Multidimensional Scaling) ㅇ 객체(데이터) 간의 근접성을 시각화하는 통계기법으로 군집분석과 유사하며 데이터의 축소를 목적으로 2차원 평면위에 데이터를 표현한다. Str.. 더보기
[ADsP] (3과목) 데이터 분석 - 통계분석 Part2 기출문제 1. 다음 중 회귀분석을 수행하기 위한 가정사항이 아닌 것은 무엇인가? ① 선형성 ② 등분산성 ③ 정규성 ④ 공분산성 ※ 정답 : 4번 2. 다음은 무엇에 대한 설명인가? 회귀분석에서 각 독립변수에 대한 회귀계수를 추정하기 위한 방법으로 잔차의 제곱합이 최소가 되는 회귀식을 찾는 방법이다. ( 최소제곱법 ) 3. 다음은 종속변수 y를 추정하기 위해 독립변수 x에 대하여 회귀분석을 수행한 결과이다. 다음 중 결과를 잘못 해석한 것은 무엇인가? ① 유의수준 0.05 이내에서 위 결과는 통계적으로 유의하다. ② 해당 결과는 전체 데이터의 79.29%를 설명하고 있다. ③ x의 회귀계수는 3.6471로 추정된다. ④ F 통계량의 자유도로 보아 9개의 데이터로 회귀분석을 수행하였다. ※ 정답 : 4번 : 10개 .. 더보기