* 퇴근후딴짓 님의 강의를 참고하였습니다. *
1. 시험 응시환경
ㅇ print()문을 활용해서 출력해야 함
ㅇ 코드 힌트 사용할 수 없음. help(), dir(), __all__ 활용
- dir()을 통해 사용가능한 함수 확인 가능(스펠링 기억 안날 때) : print(dir(pd)) / print(dir(pd.DataFrame))
- help()를 통해 함수 사용방법 확인 ; print(help(pd.DataFrame.drop)) / print(help(pd.get_dummies))
- sklearn에서는 __all__을 활용 : print(sklearn.__all__) / print(sklearn.preprocissing.__all__) / print(help(sklearn.preprocessing.MinMaxScaler))
ㅇ 1분 안에 전체 코드 돌아가게 해야함
ㅇ 시각화 미지원
ㅇ 실제 응시환경 체험해보기 : 구름 바로가기
2. 시험유형(예시문제)
ㅇ 작업형 1 : 평균, 표준편차 등 내장함수, loc, iloc, 결측치 처리, 이상치 구하기 등 판다스 활용
- 특정 값을 임의 대입해서 출력하면 안되고, 파이썬 코딩을 통해 출력하도록 할 것.
ㅇ 작업형 2 : 머신러닝(분류/회귀)
- 분류 문제 출제빈도가 높으며, 이상치 처리는 깔끔한 데이터가 나오는 편
- 예시코드를 안알려주는 경우가 있으므로 csv파일 생성 연습하기(ID/Index, 예측값)
- 데이터set이 2개(train, test)/3개(X_train, y_train, X_test) 주어졌을 때 풀이가 다르므로 주어진 데이터 활용
- 검증데이터
- 하이퍼 파라미터 튜닝
- 범주형 데이터 변환 못하는 경우 수치형 데이터만 활용하기
ㅇ 작업형 3 : 가설검정(T검정-단일/독립표본/쌍체표본, 독립성검정, 일원배치법)
3. 빅분기 시험 전 Tip
ㅇ 크롬, 한영전환, 키보드, 마우스 등 사전 컴퓨터 환경 체크하기
ㅇ 주석처리 환경설정 : 설정에서 단축키맵 Sublinetext 선택
ㅇ EDA (data 샘플보기) : tab별로 눌러서 데이터 샘플 대략적으로 확인하기
ㅇ 컬럼명이 전부 출력되지 않는 경우 사용하기 : pd.set_option('display.max_columns', None)
ㅇ 정지버튼(새로고침X) : 저장도 하고, 내용도 복사해놓고 새로고침(초기화) 하기
ㅇ Copy 워닝이 뜨는 경우 .copy() 붙여주면 됨
ㅇ 표준편차/분산 : 판다스랑 넘파이랑 결과값이 다른데 시험에서 요구하는건 판다스로 구하기
ㅇ 메모장에 dir/help/all에 나온 내용들 붙여넣고 Ctrl+F로 찾아서 확인
ㅇ 대괄호와 소괄호 : [ ] 는 데이터를 선택 할 때, ( ) 함수 호출 및 실행할 때 사용
ㅇ print문을 활용해 작업 전/후 확인 후 주석처리 해주기
4. 에러유형
ㅇ 에러유형 1 : 스케일링 > 2D 데이터 입력 필요
ValueError: Expected 2D array, got 1D array instead: -> 시리즈 형태로 들어갔음
ㅇ 에러유형 2 : 괄호 개수가 안맞음
SyntaxError: unexpected EOF while parsing
ㅇ 에러유형 3 : 모델학습(결측치) > 결측치 처리 필요
Input contains NaN, infinity or a value too large for dtype('float32')
ㅇ 에러유형 4 : 데이터row 수가 다른 경우로 데이터 크기가 다른 경우(X_train, y_train) > 데이터 전처리(삭제) 시, X_train, y_train 합쳐서 작업할 것
Found input variables with inconsistent numbers of samples: [138, 142]
'자격증공부 > 빅데이터분석기사' 카테고리의 다른 글
[빅데이터분석기사] 작업형2 기출문제 2회 (분류) (0) | 2023.06.10 |
---|---|
[빅데이터분석기사] 작업형2 예시문제 (분류) (0) | 2023.06.09 |
[빅데이터분석기사] 작업형1 문제유형 (기초통계, 그룹통계, 날짜) (0) | 2023.06.07 |
[빅데이터분석기사] 작업형1 문제유형 (이상치, 기초통계) (0) | 2023.05.24 |
[빅데이터분석기사] 작업형1 문제유형 (결측치) (0) | 2023.05.23 |