320x100
[문제]
데이터 셋에서 qsec 컬럼을 Min-Max Scale로 변환 후 0.5보다 큰 값을 가지는 레코드(row) 수는?
1. 데이터 불러오기
import pandas as pd
df = pd.read_csv('ㅇㅇㅇㅇ.csv')
320x100
2. 스케일링하기
ㅇ 방법1 : MinMaxScaler 활용
# MinMaxScaler 활용
from sklearn.preprocessing import MinMaxScaler
data = load_data()
scaler = MinMaxScaler()
print('MinMax Scale 변환 전: \n',data['qsec'].head())
data['qsec'] = scaler.fit_transform(data[['qsec']])
print('MinMax Scale 변환 후: \n',data['qsec'].head())
ㅇ 방법2 : minmax_scale 활용
# minmax_scale 활용
from sklearn.preprocessing import minmax_scale
data = load_data()
print('MinMax Scale 변환 전: \n',data['qsec'].head())
data['qsec'] = minmax_scale(data['qsec'])
print('MinMax Scale 변환 후: \n',data['qsec'].head())
ㅇ 방법3 : min-max 함수 선언
# min-max 함수
def my_minmax(data):
data = (data - min(data)) / (max(data) - min(data))
return data
print('MinMax Scale 변환 전: \n',data['qsec'].head())
data['qsec'] = my_minmax(data['qsec'])
print('MinMax Scale 변환 후: \n',data['qsec'].head())
반응형
3. 0.5보다 큰 값 개수 찾기
ㅇ 방법1 : sum 활용
cond = data['qsec'] > 0.5
print(sum(cond))
ㅇ 방법2 : len 활용
cond = data['qsec'] > 0.5
print(len(data[cond]))
ㅇ 방법3 : count 활용
cond = data['qsec'] > 0.5
print(data[cond]['qsec'].count())
2023.06.12 - [자격증공부/빅데이터분석기사] - [빅데이터분석기사][작업형1] 판다스 문법 활용 요약
320x100
반응형
'자격증공부 > 빅데이터분석기사' 카테고리의 다른 글
[빅데이터분석기사] 작업형1 기출문제 3회 (기초통계, 결측치) (0) | 2023.05.22 |
---|---|
[빅데이터분석기사] 작업형1 기출문제 2회 (이상치, 기초통계) (0) | 2023.05.21 |
[빅데이터분석기사] 데이터핸들링을 위한 판다스 학습 - 작업형1 (0) | 2023.05.18 |
[빅데이터분석기사] 데이터분석을 위한 파이썬 학습 (0) | 2023.05.15 |
[빅데이터분석기사] 빅데이터분석기사 시험정보 (0) | 2023.05.07 |