본문 바로가기

자격증공부/빅데이터분석기사

[빅데이터분석기사] 실기시험 응시환경 및 Tip

320x100

빅데이터분석기사

* 퇴근후딴짓 님의 강의를 참고하였습니다. *

1. 시험 응시환경

ㅇ print()문을 활용해서 출력해야 함

ㅇ 코드 힌트 사용할 수 없음. help(), dir(), __all__ 활용

 - dir()을 통해 사용가능한 함수 확인 가능(스펠링 기억 안날 때) : print(dir(pd)) / print(dir(pd.DataFrame))

 - help()를 통해 함수 사용방법 확인 ; print(help(pd.DataFrame.drop)) / print(help(pd.get_dummies))

 - sklearn에서는 __all__을 활용 : print(sklearn.__all__) / print(sklearn.preprocissing.__all__) / print(help(sklearn.preprocessing.MinMaxScaler))

ㅇ 1분 안에 전체 코드 돌아가게 해야함 

ㅇ 시각화 미지원

ㅇ 실제 응시환경 체험해보기 : 구름 바로가기

320x100

2. 시험유형(예시문제)

ㅇ 작업형 1 : 평균, 표준편차 등 내장함수, loc, iloc, 결측치 처리, 이상치 구하기 등 판다스 활용

 - 특정 값을 임의 대입해서 출력하면 안되고, 파이썬 코딩을 통해 출력하도록 할 것.

ㅇ 작업형 2 : 머신러닝(분류/회귀)

 - 분류 문제 출제빈도가 높으며, 이상치 처리는 깔끔한 데이터가 나오는 편

 - 예시코드를 안알려주는 경우가 있으므로 csv파일 생성 연습하기(ID/Index, 예측값)

 - 데이터set이 2개(train, test)/3개(X_train, y_train, X_test) 주어졌을 때 풀이가 다르므로 주어진 데이터 활용 

 - 검증데이터

 - 하이퍼 파라미터 튜닝

 - 범주형 데이터 변환 못하는 경우 수치형 데이터만 활용하기

ㅇ 작업형 3 : 가설검정(T검정-단일/독립표본/쌍체표본, 독립성검정, 일원배치법)

반응형

3. 빅분기 시험 전 Tip

ㅇ 크롬, 한영전환, 키보드, 마우스 등 사전 컴퓨터 환경 체크하기

ㅇ 주석처리 환경설정 : 설정에서 단축키맵 Sublinetext 선택

ㅇ EDA (data 샘플보기) : tab별로 눌러서 데이터 샘플 대략적으로 확인하기

ㅇ 컬럼명이 전부 출력되지 않는 경우 사용하기 : pd.set_option('display.max_columns', None)

ㅇ 정지버튼(새로고침X) : 저장도 하고, 내용도 복사해놓고 새로고침(초기화) 하기

ㅇ Copy 워닝이 뜨는 경우 .copy() 붙여주면 됨

ㅇ 표준편차/분산 : 판다스랑 넘파이랑 결과값이 다른데 시험에서 요구하는건 판다스로 구하기

ㅇ 메모장에 dir/help/all에 나온 내용들 붙여넣고 Ctrl+F로 찾아서 확인

ㅇ 대괄호와 소괄호 : [ ] 는 데이터를 선택 할 때, ( ) 함수 호출 및 실행할 때 사용

ㅇ print문을 활용해 작업 전/후 확인 후 주석처리 해주기

 

4. 에러유형

ㅇ 에러유형 1 : 스케일링 > 2D 데이터 입력 필요

ValueError: Expected 2D array, got 1D array instead: -> 시리즈 형태로 들어갔음

ㅇ 에러유형 2 : 괄호 개수가 안맞음

SyntaxError: unexpected EOF while parsing

ㅇ 에러유형 3 : 모델학습(결측치) > 결측치 처리 필요

 Input contains NaN, infinity or a value too large for dtype('float32')

ㅇ 에러유형 4 : 데이터row 수가 다른 경우로 데이터 크기가 다른 경우(X_train, y_train) > 데이터 전처리(삭제) 시, X_train, y_train 합쳐서 작업할 것

Found input variables with inconsistent numbers of samples: [138, 142]

320x100
반응형