본문 바로가기
개발자 IT 최신 정보

빅데이터분석기사 실기 기출문제 풀이 데이터 수집 작업 (2)

by hotcoding 2022. 10. 8.
반응형

안녕하세요! Hotshot 블로그입니다.
DIP 대구 빅데이터활용센터 유튜브 채널에서 제공하는 빅데이터분석기사 실기 문제로 블로그 포스팅을 하려고 합니다. 여러분도 DIP 대구 빅데이터활용센터 많이 활용해주세요^^


빅데이터분석기사 대구빅데이터활용센터 기출

작업형 유형 1 문제(2)

특정 비율만큼 데이터와 결측치 대체, 전처리 전후 표준편차 비교

  • 데이터 첫번째 행부터 70%까지의 데이터 추출한 후
  • distance(거리)의 결측값을 distance(거리)의 중앙값으로 대체하고
  • 결측값 전처리 전과 후의 표준편차를 비교
  • 전/후 결과값 print 출력
seaborn, pandas, numpy 라이브러리 불러오기
import seaborn as sns
import pandas as pd
import numpy as np
seaborn 'planets' 데이터 불러오기
df=sns.load_dataset('planets')
df.head
len길이만큼 데이터를 잘라서 df 변수에 할당
len = int(len(df)*0.7)
len길이만큼 데이터를 잘라서 df에 할당
df=df[:len]
df.head
df2를 복사하여 생성
df2=df.copy()
df2.head
df2의 distance 열 결측치를 중앙값으로 대체
df2['distance']=df2['distance'].fillna(df2['distance'].median())
df2.head
결측치 전의 distance열의 표준편차와 결측치 보정후 distance열의 표준편차를 print함수로 출력
print('전처리 전', np.std(df['distance']))
print('전처리 후', np.std(df2['distance']))

아래 빅데이터분석기사 실기 기출문제 풀이영상도 맛보기로 올려드리겠습니다.

inpyb 파일도 같이 올려드릴 테니 참조하면서 빅데이터분석기사 실기 공부하세요!

 

빅데이터분석기사_대구빅데이터활용센터_기출_작업형_유형_1_문제(2).ipynb
0.01MB

반응형