본문 바로가기

전체 글

[빅데이터분석기사][작업형2] 4회 기출문제 풀이 (분류, 2개 데이터set) * 퇴근후딴짓 님의 강의를 참고하였습니다. * [문제] 자동치 시장 세분화 (분류) 자동차 회사는 새로운 전략을 수립하기 위해 4개의 시장으로 세분화하였습니다. 기존 고객 분류 자료를 바탕으로 신규 고객이 어떤 분류에 속할지 예측해주세요. ㅇ 예측할 값 : "Segmentation" (1,2,3,4) ㅇ 평가 : Macro f1-score ㅇ data : train.csv, test.csv ㅇ 제출형식 : ID, 값 1. 라이브러리 및 데이터 읽어오기 # 라이브러리 불러오기 import pandas as pd # 데이터 불러오기 train = pd.read_csv("train.csv") test = pd.read_csv("test.csv") 2. EDA # 데이터 크기 확인 train.shape, tes.. 더보기
[빅데이터분석기사][작업형3] 예시문제 (쌍체표본 t-검정) * 퇴근후딴짓 님의 강의를 참고하였습니다. * [ 문제 ] 주어진 데이터(data/blood_pressure.csv)에는 고혈압 환자 120명의 치료전후의 혈압이 저장되어 있다. 해당 치료가 효과가 있는지 (즉, 치료 후의 혈압이 감소했는지) 쌍체표본 t-검정(paried t-test)를 통해 답하고자 한다. 가설은 아래와 같다. μd : (치료 후 혈압 - 치료전 혈압)의 평균 Η0 : μd >= 0 H1 : μd < 0 - bp_before : 치료 전 혈압 - bp_after : 치료 후 혈압 1) μd의 표본평균을 입력하시오. (반올림하여 소수 둘째자리까지 계산) 2) 위의 가설을 검정하기 위한 검정통계량을 입력하시오. (반올림하여 소수 넷째자리까지 계산) 3) 위의 통계량에 대한 p값을 구하여 .. 더보기
[빅데이터분석기사][유형2] 문제유형 풀어보기(다항분류) [문제] 자동차시장 세분화 ㅇ 자동차 회사는 새로운 전략 수립을 위해 4개의 시장으로 세분화 했습니다. 기존 고객 분류 자료를 바탕으로 신규 고객이 어떤 분류에 속할 지 예측해주세요. - 데이터 : X_train, y_train, X_test - 예측값(y) : "Segmentation" (1,2,3,4) - 평가 : Macro f1-score - 제출형식 : ID, Segmentation [풀이] # 다항분류 f1-score 평가 : f1_score(y_val, pred, average='macro') # 사용 라이브러리 import import pandas as pd # x_train.csv, y_train.csv, x_test.csv 읽어오기 X_train = pd.read_csv('X_train... 더보기
[빅데이터분석기사][작업형1] 5회 기출문제 풀이(기초통계, 정렬) * 퇴근후딴짓 님의 강의를 참고하였습니다. * [문제1] 종량제 봉투 종류가 '규격봉투'이고, 종량제 봉투 용도가 '음식물쓰레기'인 2L가격 평균을 출력하시오 (단, 가격0 제외, 반올림 후 정수 출력) import pandas as pd df = pd.read_csv("5-1price.csv") # print(df.head(3)) # print(df.info()) # print(df.shape) cond1 = df['종량제봉투종류'] == '규격봉투' cond2 = df['종량제봉투용도'] == '음식물쓰레기' cond3 = df['2ℓ가격'] > 0 df = df[cond1&cond2&cond3] print(round(df['2ℓ가격'].mean())) [문제2] bmi를 계산하고, 수치가 정상인 사.. 더보기
[빅데이터분석기사] 작업형2 문제유형 (분류) * 퇴근후딴짓 님의 강의를 참고하였습니다. * [ 문제 ] 심장마비 확률이 높은 사람 ㅇ 파일 : train.csv, test.csv ㅇ 타겟 : output(1:심장마비 확률 높음, 0:심장마비 확률 낮음) ㅇ 평가 : ROC_AUC, 정확도(Accuracy), F1 ㅇ 데이터 : 성별, 나이, 혈압, 콜레스테롤, 공복혈당, 최대심박수 등의 컬럼이 있음 [ 풀이 ] 1. 라이브러리 데이터 불러오기 2. EDA import pandas as pd train = pd.read_csv('train.csv') test = pd.read_csv('test.csv') print(train.shape, test.shape) train.head(2) test.head(2) train.isnull().sum() tes.. 더보기
[빅데이터분석기사] 작업형2 문제유형 (회귀) * 퇴근후딴짓 님의 강의를 참고하였습니다. * [ 문제 ] 에어비앤비 가격 ㅇ 데이터 : train.csv, test.csv ㅇ 타겟 : price(가격) [ 풀이 ] 1. 라이브러리 및 데이터 불러오기 import pandas as pd train = pd.read_csv('train.csv') test = pd.read_csv('test.csv') print(train.shape, test.shape) 2. EDA train.head(3) test.head(2) train.isnull().sum() test.isnull().sum() train['price'].describe() #그림을 그릴 수 없어서 대략적인 분포 확인 train.info() 3. 데이터전처리 및 피처엔지니어링 ㅇ 결측치 처리 t.. 더보기
[재테크][부동산] 백승님의 일본부동산 투자 노하우 강의후기 [ Intro ] 23.06.10 신세계 아카데미 강남점에서 진행한 백승님의 일본부동산 투자 강의를 다녀왔다. 역시 많은 사람들이 투자, 재테크에 관심을 가지고 있었고, 나 역시 처음에는 수강인원이 Full이었는지 대기 상태로 있다가 신청할 수 있었다. 요즘 일본 엔화가 저렴해서 그런지 사람들이 특히 일본에 투자하는 방법을 찾고 있는 듯 하다. 아직 부동산 한채도 없는 초보 투자자인 나에게는 머나먼 일 인 것 같지만 (한국 부동산 부터....) 언젠가는 나도 해외 부동산에 투자할 일이 생길 것이라 믿고 강의를 듣고 왔다. 어릴 때 빨리 재테크의 중요성을 꺠닫고 빠르게 투자를 실천하는게 역시 최고인 것 같다. 선구자가 되면 시행착오를 통해 고생도 하겠지만 결국 투자는 우상향하면서 수익을 얻게 되고, 이런 .. 더보기
[재테크][투자전략] 체계적으로 돈 관리 하기 위한 재테크 시작하기 * 아래 재테크 지식은 Class101의 재테크는스크루지님의 강의를 참고하여 요약하였고, 제 상황에 맞게 강의에서 들은 내용을 실천하며 기록하였습니다.* Intro 누구나 돈은 많이 벌고 싶고, 자산을 증식하고 싶어 투자 등의 재테크를 하게 된다. 직장생활을 하는 나 역시 이런 생각은 가득했고 어설프게 주식 등에 투자하고 있었지만 잘 알지 못하는 상태였다. 그러던 중 제대로 강의를 들으면서 본격적으로 공부해야 겠다는 생각이 들었고, Class101수강권이 있어 '재테크는스크루지'님의 '[엑셀시트 제공] 7년간 순자산 10배! 돈관리부터 주식 포트폴리오까지 A to Z' 강의를 들으면서 나름대로 요약하고 내 상황에 맞춰서 실천하면서 블로그에 기록하기로 한다. 물론 강의에서 제공하는 첨부파일은 스크루지님의 .. 더보기