본문 바로가기
개발자 IT 최신 정보

[빅데이터분석기사 필기 공부] 통계학

by hotcoding 2022. 10. 13.
반응형

1. 통계학 개요

통계학이란 '특정집단을 대상으로 수행한 조사나 실험을 통해 나온 결과에 대한 요약 표현'이라고 말할 수 있다.

쉽게 이해해서 데이터를 정보로 만드는 과정이라고 볼 수도 있다.

해당 내용은 이 링크를 참조.

 

자료(Data)의 수집, 정리, 해석 이 세가지가 통계학의 핵심이 된다.

2. 통계학의 분류

통계학은 크게 기술통계학과 추론통계학으로 구분된다.

기술통계학이란 '관찰된 통계집단의 성질을 기술하는 것을 목적으로 통계 데이터를 정리·요약하는 방법을 고찰하는 통계학'이라고 한다. 예시로 운동선수의 기록이나 성적을 들 수 있다.

반대로 집단의 상태를그로부터 추출한 표본에서 수리적으로 추측하는 것을 추론통계학이라고 한다. 예시는 정치인의 지지도를 들 수가 있다.

3. 통계자료 획득방법

획득방법은 총 조사와 표본조사로 나누어진다.

3.1 총 조사(Census)

일정한 사회 집단 전체를 대상으로 하는 대규모 전수 조사. 오늘날에는 인구 주택 총조사, 농림어업 총조사 외에 경제 총조사 등과 같이 집단을 구성하는 단위를 전수 조사 하여, 그 크기ㆍ구조 등을 파악하는 경우에도 쓰인다.

 

3.2 표본조사

모집단(Population) : 조사하고자 하는 대상 집단 전체
원소(Factor) : 모집단 구성개체
표본(Sample) : 모집단의 일부 원소(부분집합)
모수(Parameter): 모집단의 속성, 특징을 나타내는 통계값(모평균, 모표준편차, 모상관계수)
※ 모집단의 정의, 표본의 크기, 조사방법, 조사기간, 표본추출방법을 정확하게 명시해야 한다.

 

표본조사도 확률표본추출과 비확률표본추출로 나뉘어진다.

3.2.1 확률 표본추출과 비확률 표본추출

확률 표본추출은 '표본수집 틀', 줄여서 '표집틀'이라고도 불리는 표본추출 프레임(sampling frame)에서 연구자의 인위적인 개입을 가급적 배제하면서 무작위(random) 표본추출 방법을 적용해 동일한 확률로 모집단의 모든 구성원들을 표본으로 뽑을 수 있다. 반면, 비확률 표본추출은 그렇지 못하다.

확률포본추출

- 단순랜덤추출법 : 임의의 n개 추출하는 방법 -> 각 샘플은 선택될 확률이 동일. 그러나 현실적으로 어려움. 이상적인 방법임.
 - 계통추출법 :  모집단의 개체에 1,2,….N이라는 일련번호를 부여한 후, 첫번째 표본을 임의로 선택하고 일정 간격으로 다음 표본을 선택.
 - 층화추출법 : 이질적인 원소들로 구성된 모집단에서 각 계층을 고루 대표할수 있도록 표본 추출

남자 8 : 여자 2일 때 8 : 2로 지급
 - 집락추출법 : 군집을 구분하고 군집별로 단순랜덤추출법. 예시로 지역표본추출, 다단계표본추출 등이 있음.

비확률포본추출

연구자의 판단이 개입할 가능성이 있음.
 - 판단추출법    
 - 할당추출법 
 - 편의추출법 
 - 지원자 표본 추출법

반응형

댓글