본문 바로가기

자격증공부/빅데이터분석기사

[빅데이터분석기사] 작업형1 기출문제 3회 (기초통계, 결측치) * 인프런의 '퇴근후딴짓' 님의 강의를 참고하였습니다.* [문제1] 결측치 데이터(행)을 제거하고, 앞에서부터 70% 데이터만 활용해 'f1' 컬럼 1사분위 값을 구하시오. # 라이브러리 및 데이터 읽기 # 결측치 데이터(행) 제거 : dropna() # 70% 데이터 활용 # f1 컬럼의 1사분위 값 구하기 # 라이브러리 및 데이터 읽기 import pandas as pd df = pd.read_csv('member.csv') # 결측치 데이터(행) 제거 : dropna() # print(df.isnull().sum()) # print(df.shape) df = df.dropna() # print(df.isnull().sum()) # print(df.shape) # 70% 데이터 활용 # print(i.. 더보기
[빅데이터분석기사] 작업형1 기출문제 2회 (이상치, 기초통계) * 인프런의 '퇴근후 딴짓' 님의 강의를 참고하였습니다. * [문제1] 주어진 데이터셋의 'views' 컬럼 상위 10개 데이터를 상위 10번째 값으로 대체한 후 'age' 컬럼에서 80이상인 데이터의 'views' 컬럼의 평균 값 구하기 # 라이브러리, 데이터 읽어오기 # views 컬럼 기준으로 내림차순 정렬 후 상위 10번째 값 찾기 # views 컬럼 상위 10개값을 02에서 찾은 값으로 대체하기 # age 컬럼이 80 이상인 데이터의 view 컬럼 평균 값 구하기 #01. 라이브러리, 데이터 읽어오기 import pandas as pd df = pd.read_csv('member.csv') df.head(10) #02. views 컬럼 기준으로 내림차순 정렬 후 상위 10번째 값 찾기 df = .. 더보기
[빅데이터분석기사] 작업형1 예시문제 Min-Max Scale [문제] 데이터 셋에서 qsec 컬럼을 Min-Max Scale로 변환 후 0.5보다 큰 값을 가지는 레코드(row) 수는? 1. 데이터 불러오기 import pandas as pd df = pd.read_csv('ㅇㅇㅇㅇ.csv') 2. 스케일링하기 ㅇ 방법1 : MinMaxScaler 활용 # MinMaxScaler 활용 from sklearn.preprocessing import MinMaxScaler data = load_data() scaler = MinMaxScaler() print('MinMax Scale 변환 전: \n',data['qsec'].head()) data['qsec'] = scaler.fit_transform(data[['qsec']]) print('MinMax Scale 변환.. 더보기
[빅데이터분석기사] 데이터핸들링을 위한 판다스 학습 - 작업형1 1. 판다스(pandas) : 정형데이터를 다룰 때 편리한 파이썬 패키지 - csv 파일 형태(c : 콤마)로 콤마로 데이터 구분이 된 데이터를 읽어올 수 있음 - 판다스로 csv파일을 불러오면 DataFrame 형태로 예쁘게 불러올 수 있고, range index가 0부터 붙여지게됨. - 즉, 판다스는 DataFrame 형태로 데이터를 읽어서 핸들링할 수 있는 패키지 2. 라이브러리 및 csv파일 불러와서 변수에 저장하기 ㅇ import pandas as pd ㅇ df = pd.read_csv('파일명.csv') ㅇ df.head() / df.tail() # 판다스 라이브러리 불러오기 import pandas as pd # 데이터 불러와서 변수에 담기 df = pd.read_csv('ㅇㅇㅇ.csv') .. 더보기
[빅데이터분석기사] 데이터분석을 위한 파이썬 학습 1. 데이터출력, 연산, 자료유형, 형변환, 비교, 조건문 ㅇ 주석 : # - 단축키(Windows) : Ctrl + / ㅇ 데이터 출력 : pirnt() - 숫자 : print(2022) - 문자 : 큰따옴표 or 작음따옴표 print('happy') / print("happy") ㅇ 산술연산자 : +.-,*,/, //(몫), %(나머지), **(제곱) ㅇ 자료유형 확인 : type() - 정수형(int) , 실수형(float), 문자열(str), 참/거짓(bool) ㅇ 변수를 활용하여 값 대입, 연산 가능 ㅇ 형변환 : int(문자변수명) / str(숫자변수명) - 숫자에 " "를 붙이면 문자로 인식 ㅇ 비교연산자 : > , =, ==, != ㅇ 조건문 : if ㅇㅇ: elif else: # 주석입니.. 더보기
[빅데이터분석기사] 빅데이터분석기사 시험정보 [자격증 소개] ㅇ 소개 : 빅데이터 이해를 기반으로 빅데이터 분석기획, 빅데이터 수집/저장/처리, 빅데이터 분석 및 시각화를 수행하는 실무자를 빅데이터분석기사라고 정의한다. ㅇ 주관 : 한국데이터산업진흥원 ㅇ 필요성 : 전 세계적으로 빅데이터가 미래성장동력으로 인식돼, 각국 정부에서는 관련 기업투자를 끌어내는 등 국가, 기업의 주요 전략분야로 부상하고 있다. 국가와 기업의 경쟁력 확보를 위해 빅데이터분석 전문가의 수요는 증가하고 있으나, 수요 대비 공급 부족으로 인력 확보에 어려움이 높은 실정이다. 이에 정부차원에서 빅데이터분석 전문가 양성과 함께 체계적으로 역량을 검증할 수 있는 국가기술자격 수요가 높은 편이다. [시험과목] ㅇ 필기 - 객관식 - 과목당 20문항이며, 4과목으로 총 80문항 - 시험.. 더보기