본문 바로가기

자격증공부/빅데이터분석기사

[빅데이터분석기사] 작업형1 예시문제 Min-Max Scale

320x100

빅데이터분석기사

 

[문제]

데이터 셋에서 qsec  컬럼을 Min-Max Scale로 변환 후 0.5보다 큰 값을 가지는 레코드(row) 수는?

 

1. 데이터 불러오기

import pandas as pd
df = pd.read_csv('ㅇㅇㅇㅇ.csv')

빅데이터분석기사

320x100

 

2. 스케일링하기

ㅇ 방법1 : MinMaxScaler 활용

# MinMaxScaler 활용
from sklearn.preprocessing import MinMaxScaler

data = load_data()
scaler = MinMaxScaler()
print('MinMax Scale 변환 전: \n',data['qsec'].head())
data['qsec'] = scaler.fit_transform(data[['qsec']])
print('MinMax Scale 변환 후: \n',data['qsec'].head())

빅데이터분석기사

ㅇ 방법2 : minmax_scale 활용

# minmax_scale 활용
from sklearn.preprocessing import minmax_scale

data = load_data()
print('MinMax Scale 변환 전: \n',data['qsec'].head())
data['qsec'] = minmax_scale(data['qsec'])
print('MinMax Scale 변환 후: \n',data['qsec'].head())

ㅇ 방법3 : min-max 함수 선언

# min-max 함수
def my_minmax(data):
    data = (data - min(data)) / (max(data) - min(data))
    return data

print('MinMax Scale 변환 전: \n',data['qsec'].head())
data['qsec'] = my_minmax(data['qsec'])
print('MinMax Scale 변환 후: \n',data['qsec'].head())
반응형

 

3. 0.5보다 큰 값 개수 찾기

ㅇ 방법1 : sum 활용

cond = data['qsec'] > 0.5
print(sum(cond))

ㅇ 방법2 : len 활용

cond = data['qsec'] > 0.5
print(len(data[cond]))

ㅇ 방법3 : count 활용

cond = data['qsec'] > 0.5
print(data[cond]['qsec'].count())

 

2023.06.12 - [자격증공부/빅데이터분석기사] - [빅데이터분석기사][작업형1] 판다스 문법 활용 요약

 

[빅데이터분석기사][작업형1] 판다스 문법 활용 요약

1. 라이브러리 및 데이터 읽어오기 ㅇ 컬럼명 확인할 수 있도록 세팅하기 import pandas as pd df = pd.read_csv('ㅇㅇㅇㅇ.csv') pd.set_option('display.max_columns', None) #컬럼명 전부 확인할 수 있도록 셋팅하기 2.

inform.workhyo.com

 

320x100
반응형