본문 바로가기

데이터마이닝

[경영빅데이터분석사2급] 4과목 빅데이터 분석 - 데이터마이닝 4. 데이터 마이닝 ㅇ 개념 : 의미 있는 패턴, 규칙, 관계를 찾아내는 것이며 많은 DB로부터 지금까지 잘 알려지지 않고 유용하며 활용이 가능한 정보를 추출하는 과정 ㅇ 특징 : 사용자의 경험이나 편견을 배제하고 전적으로 데이터에 기반으로 하여 지식과 패턴을 추출하기 때문에 영역 전문가가 간과해 버릴 수도 있는 지식과 패턴을 찾아낼 수 있다. 또한 분석가의 경험이 높고 낮음에 따른 차이가 적어 일정범위 안에서는 유사한 결론을 얻을 수 있어 업무 경험을 통한 학습보다 유리하다. ㅇ 활용분야 : 카드사의 사기 발견, 금융권 대출승인, 투자분석, 기업의 마케팅 및 판매데이터 분석, 생산 프로세스 분석, 기타 순수 과학 분야의 자료 분석 등 특별히 제한되는 분야는 없다. ㅇ 기법 - 정형 : 연관관계분석, 의.. 더보기
[ADsP] (3과목) 데이터 분석 - 데이터마이닝, 분류분석 요약 1. 개요 방대한 양의 데이터 속에서 숨겨진 규칙, 패턴 등을 찾고 예측 및 의사결정에 활용가능한 가치를 탐색, 이렇게 발견된 규칙 및 패턴을 컴퓨터가 학습하는 것이 기계학습, 심층학습, 강화학습이라 지칭함. (유튜브, 알파고, 넷플릭스 등) ㅇ 종류 : 정형/비정형 데이터 마이닝 ㅇ 통계분석은 가설이나 가정에 따른 분석이나 검증을 하지만, 데이터마이닝은 데이터로부터 의미있는 저보를 찾아내는 방법을 통칭 2. 데이터마이닝 방법에 따른 분류 ㅇ 지도학습 : 정답이 있는 데이터를 활용하여 분석 모델을 구축하는 것 (ex. 회귀분석, 의사결정트리, 인공신경망 모형, 로지스틱회귀분석 등) ㅇ 비지도학습 : 정답이 없는 데이터들 사이의 유사성, 거리를 활용하여 그룹화하거나 규칙을 파악하는 것. (ex. 군집분석,.. 더보기