본문 바로가기

자격증

[빅데이터분석기사] 빅데이터분석기사 시험정보 [자격증 소개] ㅇ 소개 : 빅데이터 이해를 기반으로 빅데이터 분석기획, 빅데이터 수집/저장/처리, 빅데이터 분석 및 시각화를 수행하는 실무자를 빅데이터분석기사라고 정의한다. ㅇ 주관 : 한국데이터산업진흥원 ㅇ 필요성 : 전 세계적으로 빅데이터가 미래성장동력으로 인식돼, 각국 정부에서는 관련 기업투자를 끌어내는 등 국가, 기업의 주요 전략분야로 부상하고 있다. 국가와 기업의 경쟁력 확보를 위해 빅데이터분석 전문가의 수요는 증가하고 있으나, 수요 대비 공급 부족으로 인력 확보에 어려움이 높은 실정이다. 이에 정부차원에서 빅데이터분석 전문가 양성과 함께 체계적으로 역량을 검증할 수 있는 국가기술자격 수요가 높은 편이다. [시험과목] ㅇ 필기 - 객관식 - 과목당 20문항이며, 4과목으로 총 80문항 - 시험.. 더보기
[경영빅데이터분석사] 경영빅데이터분석사 자격증 시험정보 [자격증 소개] ㅇ 소개 - 빅데이터 경영 업무에 필요한 이론과 실무능력을 검증하는 자격시험제도입니다. 경영 빅데이터 분석사 시험의 기본 목적은 빅데이터 분석 전문가를 양성하려는데 있습니다. 빅데이터 분석 전문가란 빅데이터 이해 및 처리 기술에 대한 기본지식을 바탕으로 빅데이터 분석 기획, 빅데이터 분석, 빅데이터 시각화 업무를 수행하고 이를 통해 프로세스 혁신 및 마케팅 전략 결정 등의 과학적 의사결정을 지원하는 직무를 수행하는 전문가를 말합니다. ㅇ 주관 : 민각 자격으로 한국경제신문, 씨에스랩(주) 공동발급 [필요성] 폭증하는 데이터가 경제적 자산이 되고 가치창출의 원천이 되는 빅데이터 시대에 도래하였습니다. 기업은 치열한 경쟁환경에서 영향력이 강해진 고객을 만족시키기 위하여 고객의 행동 맥락과 감.. 더보기
[ADsP] (3과목) 데이터분석 - 군집분석과 연관분석 기출문제 1. 군집분석을 실시하기 위한 여러 거리 측도 중 범주형 데이터 거리를 계산하기 위한 측도는 무엇인가? ① 유클리디안 거리 ② 자카드 거리 ③ 맨하튼 거리 ④ 표준화 거리 ※ 정답 : 2번 2. 아래의 표를 보고 두 데이터 A와 B의 맨하튼 거리와 체비셰프 거리를 바르게 구한 것은? 맨하튼 거리 체비셰프 거리 ① 9 29 ② 4 29 ③ 9 4 ④ 4 4 ※ 정답 : 3번 - 맨하튼 : 차이 값들의 합 =2+3+4 = 9 - 체비셰프 : 최대값인 4 3. 다음 중 계층적 군집분석에 대한 설명으로 부적절한 것은 무엇인가? ① 범주형 데이터에서도 거리 측정이 가능하므로 분석 기법을 적용할 수 있다. ② R에서 최장연결법으로 수행하기 위해서는 complete를 사용한다. ③ 최장연결법은 가장 거리가 먼 데이터.. 더보기
[ADsP] (3과목) 데이터 분석 - 군집분석과 연관분석 요약 1.개요 ㅇ 비지도 학습 중 하나로 여러 변수로 표현된 데이터들 사이의 유사성을 측정하고 몇 개의 군집으로 나누어 특징을 파악하는 기법. 생물학에서 종의 분류, 마케팅에서의 시장 세분화 및 고객 성향 분석, 추천 시스템을 위한 협업 필터링 등 서비스의 기반을 제공 2. 종류 ㅇ 계층적 군집분석 : 병합적 방법 ㅇ 비계층적 군집분석 : 계층을 보유하지 않음. K평균 군집 3. 거리측도 ㅇ 연속형 변수 - 유클리디안 거리 : 두 점 사이의 거리를 계산하는 대표적인 방법으로 통계적 개념이 포함되지 않아 변수들의 산포 정도를 고려하지 않음 (가장 가까운 거리) - 맨하튼 거리 : 시가거리라고도 하며 도시에서 최단 거리를 구하듯 각 변수들의 차이의 단순 합으로 계산한 거리 - 체비셰프 거리 : 변수간 거리 차이 .. 더보기
[ADsP] (3과목) 데이터 분석 - 데이터마이닝, 분류분석 기출문제 1. 다음 중 대용량 데이터 속에서 숨겨진 지식 또는 새로운 규칙을 추출해 내는 과정을 일컫는 것은? ① 지식경영 ② 의사결정지원시스템 ③ 데이터웨어하우징 ④ 데이터마이닝 ※ 정답 : 4번 2. 다음 중 기법의 활용 분야가 나머지와 다른 하나를 고르시오. ① 로지스틱 회귀분석 ② 인공신경망 ③ 의사결정나무 ④ SOM ※ 정답 : 4번 3. 다음 중 나머지와 분석 방법이 다른 것은? ① k-means clustering ② single linkage method ③ DBSCAN ④ 주성분분석 ※ 정답 : 4번 - 1~3번은 군집분석 4. 아래의 데이터 마이닝 분석 예제 중 비지도 학습을 수행해야 하는 예제는? (가) 우편물에 인쇄된 우편번호 판별 분석을 통해 우편물을 자동으로 분류 (나) 고객의 과거 거래.. 더보기
[ADsP] (3과목) 데이터 분석 - 데이터마이닝, 분류분석 요약 1. 개요 방대한 양의 데이터 속에서 숨겨진 규칙, 패턴 등을 찾고 예측 및 의사결정에 활용가능한 가치를 탐색, 이렇게 발견된 규칙 및 패턴을 컴퓨터가 학습하는 것이 기계학습, 심층학습, 강화학습이라 지칭함. (유튜브, 알파고, 넷플릭스 등) ㅇ 종류 : 정형/비정형 데이터 마이닝 ㅇ 통계분석은 가설이나 가정에 따른 분석이나 검증을 하지만, 데이터마이닝은 데이터로부터 의미있는 저보를 찾아내는 방법을 통칭 2. 데이터마이닝 방법에 따른 분류 ㅇ 지도학습 : 정답이 있는 데이터를 활용하여 분석 모델을 구축하는 것 (ex. 회귀분석, 의사결정트리, 인공신경망 모형, 로지스틱회귀분석 등) ㅇ 비지도학습 : 정답이 없는 데이터들 사이의 유사성, 거리를 활용하여 그룹화하거나 규칙을 파악하는 것. (ex. 군집분석,.. 더보기
[ADsP] (3과목) 데이터 분석 - 통계분석 Part3 요약 1. 상관분석 ㅇ 상관계수를 활용한 분석방법으로 두 변수간 선형적 관계 존재 유무를 파악하기 위함 ㅇ 상관분서 귀무가설은 ‘두 변수간 상관관계는 존재하지 않는다’ 이다. ㅇ 상관계수 r의 범위는 -1~1이며, 0에 가까울수록 상관이 낮다고 말한다. ㅇ 종류 - 피어슨 상관분석 : 두 변수간 양적 척도인 경우, 두 변수 간의 선형관계의 크기 측정, 상관관계가 존재하지 않는 경우 0이다. - 스피어만 상관분석 : 두 변수가 순서 척도인 경우, 두 변수간의 선형/비선형적 관계 나타낼 수 있음 2. 다차원 척도법 (MDS : Multidimensional Scaling) ㅇ 객체(데이터) 간의 근접성을 시각화하는 통계기법으로 군집분석과 유사하며 데이터의 축소를 목적으로 2차원 평면위에 데이터를 표현한다. Str.. 더보기
[ADsP] (3과목) 데이터 분석 - 통계분석 Part2 기출문제 1. 다음 중 회귀분석을 수행하기 위한 가정사항이 아닌 것은 무엇인가? ① 선형성 ② 등분산성 ③ 정규성 ④ 공분산성 ※ 정답 : 4번 2. 다음은 무엇에 대한 설명인가? 회귀분석에서 각 독립변수에 대한 회귀계수를 추정하기 위한 방법으로 잔차의 제곱합이 최소가 되는 회귀식을 찾는 방법이다. ( 최소제곱법 ) 3. 다음은 종속변수 y를 추정하기 위해 독립변수 x에 대하여 회귀분석을 수행한 결과이다. 다음 중 결과를 잘못 해석한 것은 무엇인가? ① 유의수준 0.05 이내에서 위 결과는 통계적으로 유의하다. ② 해당 결과는 전체 데이터의 79.29%를 설명하고 있다. ③ x의 회귀계수는 3.6471로 추정된다. ④ F 통계량의 자유도로 보아 9개의 데이터로 회귀분석을 수행하였다. ※ 정답 : 4번 : 10개 .. 더보기