본문 바로가기

빅데이터분석

[경영빅데이터분석사2급] 4과목 빅데이터 분석 - 데이터 시각화 5. 데이터 시각화 ㅇ 데이터 시각화 : 같은 범주 안에서 많은 양의 데이터에 의미를 부여함으로써 공간에 배치된 숫자의 패턴을 인지하게 만든 것. 전통적으로 단순한 수치의 그래프나 데이터의 패턴을 파악하는 방법으로 사용되었으나 최근 빅데이터 분석에 따라 다양한 정보전달이나 상황분석을 위한 시각적 도구로 메시지 전달을 위한 시각적 표현으로 많이 사용되고 있다. ㅇ 특성 - 인간의 정보 처리 능력을 확장시켜 정보를 직관적으로 이해할 수 있게 한다. - 많은 데이터를 동시에 차별적으로 보여줄 수 있다. (균일하게 X) - 다른 방식으로는 어려운 지각적 추론을 가능하게 한다. - 보는 이로 하여금 흥미를 유발하며, 주목성이 높아지며 인간의 경험을 풍부하게 한다. - 문자보다 친근하게 정보를 전달하며, 다양한 계.. 더보기
[경영빅데이터분석사2급] 4과목 빅데이터 분석 - 데이터마이닝 4. 데이터 마이닝 ㅇ 개념 : 의미 있는 패턴, 규칙, 관계를 찾아내는 것이며 많은 DB로부터 지금까지 잘 알려지지 않고 유용하며 활용이 가능한 정보를 추출하는 과정 ㅇ 특징 : 사용자의 경험이나 편견을 배제하고 전적으로 데이터에 기반으로 하여 지식과 패턴을 추출하기 때문에 영역 전문가가 간과해 버릴 수도 있는 지식과 패턴을 찾아낼 수 있다. 또한 분석가의 경험이 높고 낮음에 따른 차이가 적어 일정범위 안에서는 유사한 결론을 얻을 수 있어 업무 경험을 통한 학습보다 유리하다. ㅇ 활용분야 : 카드사의 사기 발견, 금융권 대출승인, 투자분석, 기업의 마케팅 및 판매데이터 분석, 생산 프로세스 분석, 기타 순수 과학 분야의 자료 분석 등 특별히 제한되는 분야는 없다. ㅇ 기법 - 정형 : 연관관계분석, 의.. 더보기
[경영빅데이터분석사 2급] 4과목 빅데이터 분석 - 통계분석 3. 통계분석 : 기초통계, 설문조사, 상관관계, 회귀분석, 시계열분석, 다차원척도법(MDS), 주성분분석, 요인분석, 판별분석 ㅇ정의 : 가설 검증에 있고 많은 전제 조건을 만족시키는 경우 사용 ㅇ분류 - 기술통계학 : 수집된 자료를 정리, 요약하여 집단의 특성을 알기 쉽게 정보화 하는 방법 . 자료 : 질적자료(범주 -성별, 직업, 혈액형 등), 양적자료(키 몸무게 생산량과 같이 숫자로 표시, 이산형 – 고객 수, 차량 수와 같이 셀 수 있는 자료 / 연속형 – 길이, 무게, 온도 등과 같이 세는 것이 불가능한 자료) . 변수 : 관심의 대상이 되는 사물이나 사건의 속성 변수 척도 속성 설명 예시 특성 질적변수 명목척도 범주형 측정 대상이 어느 집단에 속하는지 분류 성별, 고객구분 연산 불가 서열척도.. 더보기
[경영빅데이터분석사 2급] 4과목 빅데이터 분석 - 빅데이터분석 프로세스 개념, 플랫폼 환경 1. 빅데이터 분석 프로세스 개념 ㅇ 분석 프로세스 절차 : 데이터 수집(분석 목적 명확화 포함) > 저장 > 처리 > 분석 > 시각화 > 이용 > 폐기 ㅇ 수집 : 수집 대상 데이터 선정 > 수집 세부 계획 수립 > 데이터 수집 실행 - 수집 대상 데이터 선정 : 빅데이터 분석 성공 여부를 결정하는 매우 중요한 단계로 분석 경험이 많은 전문가 의견이 필요하다. 목적을 달성하기 위한 수집 대상의 선정(Performance 측면) 외에도 개인정보 보호 등의 관련 규제를 준수(Compliance 측면)하여야 하며, 수집비용과 같은 원가(Cost Efficiency 측면) 또한 고려하여야 한다. - 수집 세부 계획 수립 : 데이터 소유자, 데이터 유형, 데이터 포맷 등의 데이터 특성을 고려해 계획 수립하며 기.. 더보기