반응형
안녕하세요! Hotshot 블로그입니다.
DIP 대구 빅데이터활용센터 유튜브 채널에서 제공하는 빅데이터분석기사 실기 문제로 블로그 포스팅을 하려고 합니다. 여러분도 DIP 대구 빅데이터활용센터 많이 활용해주세요^^

빅데이터분석기사 대구빅데이터활용센터 기출
작업형 유형 1 문제(2)
특정 비율만큼 데이터와 결측치 대체, 전처리 전후 표준편차 비교
- 데이터 첫번째 행부터 70%까지의 데이터 추출한 후
- distance(거리)의 결측값을 distance(거리)의 중앙값으로 대체하고
- 결측값 전처리 전과 후의 표준편차를 비교
- 전/후 결과값 print 출력
seaborn, pandas, numpy 라이브러리 불러오기
import seaborn as sns
import pandas as pd
import numpy as np
seaborn 'planets' 데이터 불러오기
df=sns.load_dataset('planets')
df.head
len길이만큼 데이터를 잘라서 df 변수에 할당
len = int(len(df)*0.7)
len길이만큼 데이터를 잘라서 df에 할당
df=df[:len]
df.head
df2를 복사하여 생성
df2=df.copy()
df2.head
df2의 distance 열 결측치를 중앙값으로 대체
df2['distance']=df2['distance'].fillna(df2['distance'].median())
df2.head
결측치 전의 distance열의 표준편차와 결측치 보정후 distance열의 표준편차를 print함수로 출력
print('전처리 전', np.std(df['distance']))
print('전처리 후', np.std(df2['distance']))
아래 빅데이터분석기사 실기 기출문제 풀이영상도 맛보기로 올려드리겠습니다.
inpyb 파일도 같이 올려드릴 테니 참조하면서 빅데이터분석기사 실기 공부하세요!
빅데이터분석기사_대구빅데이터활용센터_기출_작업형_유형_1_문제(2).ipynb
0.01MB
반응형
'개발자 IT 최신 정보' 카테고리의 다른 글
[프로그래머스 Python 3 문제풀이] 각도기, 짝수의 합, 배열의 평균값 (0) | 2022.11.06 |
---|---|
[빅데이터분석기사 필기 공부] 통계학 (0) | 2022.10.13 |
빅데이터분석기사 실기 기출문제 풀이 데이터 수집 작업 (1) (2) | 2022.10.07 |
빅데이터분석기사 실기 기출문제 풀이 데이터 수집 작업 (1) (0) | 2022.10.07 |
노트북베터리 수명 늘리는 법. 꼭 해야 하는 노트북 설정 windows11 기준 (0) | 2022.10.06 |
댓글