본문 바로가기
공부

비즈니스 리서치 방법_Week6

by hotcoding 2023. 4. 23.
반응형

이 장에서는 다음을 살펴봅니다:
일반화(외부 유효성이라고도 함) 및 대표 표본의 관련 개념;
확률 표본의 개념;
확률 표본의 주요 유형;
표본 크기 결정과 관련된 주요 문제;
다양한 유형의 비확률 표본;
조사 연구에서 잠재적인 오류의 원인.

 

기본 용어 및 개념: 1

모집단: 표본을 선택할 단위의 세계

표본: 조사를 위해 선택된 모집단의 세그먼트

샘플링 프레임: 모든 단위 리스트

대표표본: 모집단을 정확하게 반영하는 표본

표본 편향: 대표성의 왜곡

 

기본 용어 및 개념: 2

확률 표본: 랜덤 선택을 사용하여 선택한 표본

비확률 표본: 랜덤 선택 방법을 사용하지 않고 선택한 표본

표본 추출 오류: 표본과 모집단 간의 차이

비표본오차: 표본과 모집단의 차이에 대한 연구결과

무응답: 샘플 구성원이 참여할 수 없거나 참여를 거부한 경우

인구 조사: 전체 인구에서 수집한 데이터

 

표본 오류

표본과 모집단의 차이

치우친 표본이 모집단을 나타내지 않음 
일부 그룹은 과잉 대표되고, 다른 그룹은 과소 대표됨

편견의 원인
 비확률 표본 추출, 부적절한 표본 프레임, 비반응

확률 표본 추출은 표본 추출 오류를 줄이고 추정 통계량을 허용합니다

 

4가지 유형의 확률 표본

단순 랜덤 표본

 계통표본

 계층화된 랜덤 표본

 다단계 클러스터 샘플

 

 

단순 랜덤 샘플링

각 장치의 선택 확률은 동일합니다

표본 추출 비율: 해당 없음 
여기서 n = 표본 크기 및 N = 모집단 크기

모든 장치를 나열하고 연속적으로 번호를 매깁니다

난수 표를 사용하여 단위 선택

 

계통표본추출

샘플링 프레임에서 직접 단위 선택

임의의 시작점에서 모든 n번째 단위(예: 매 4번째 이름)를 선택합니다

샘플링 프레임에 고유한 순서가 없는지 확인합니다. 순서가 있으면 치우침을 제거하기 위해 다시 정렬합니다

 

계층화된 무작위 추출

인구를 '계층'(예: 관련 부서 또는 기업의 부서)으로 분류하는 것이 출발점입니다

따라서 표본은 각 층에 비례적으로 대표될 수 있다

그런 다음 각 범주 내에서 단순 랜덤 표본과 마찬가지로 랜덤하게 선택합니다

 

다단계 클러스터 샘플링

광범위하게 분산된 모집단에 유용합니다

첫째, 인구를 단위 그룹(클러스터), 예를 들어 지리적 지역이나 산업으로 나눕니다.

그런 다음 해당하는 경우 이러한 클러스터에서 하위 클러스터(하위 그룹)를 샘플링할 수 있습니다.

이제 각 (하위) 군집에서 단위를 랜덤하게 선택합니다.

각 단위 군집에서 연속적으로 데이터를 수집합니다.

 

확률 표본의 품질

대표 - 표본에서 모집단으로 일반화할 수 있습니다

추론 통계 검사 

표본 평균을 사용하여 모집단 평균을 추정할 수 있습니다

표준 오차(SE): 표본 평균과 모집단 평균 간의 불일치 추정치

표본 평균의 95%는 모집단 평균에서 +/- 1.96 SE 사이에 있음

 

표본크기

절대 크기는 상대 크기보다 중요합니다

표본이 클수록 더 정확하고 대표적일 가능성이 높습니다

표본 크기가 증가하면 표본 오차가 감소함

샘플의 한계에 대해 솔직하게 말하는 것이 중요합니다

 

표본 크기에 영향을 미치는 요인(1)

시간과 비용
특정 지점(n=1000) 이후에 표본 크기를 늘리면 정밀도에서 눈에 띄지 않는 이득을 얻을 수 있습니다
매우 큰 샘플은 점점 더 비용 효율적입니다 

무응답
응답률 = 참여에 동의한 샘플의 비율(또는 사용 가능한 데이터를 제공한 샘플의 비율)
응답자와 비응답자는 중요한 변수에 대해 다를 수 있습니다

 

표본 크기에 영향을 미치는 요인(2)

인구의 이질성
모집단이 다양할수록 표본은 더 커야 합니다

수행할 분석의 종류
일부 기법에는 큰 표본(예: 분할표, 추정 통계량)이 필요합니다

 

비확률 표본 추출 유형(1)

1. 편의성 샘플링
가장 쉽게 접근할 수 있는 개인
연구 장비를 조종할 때 유용합니다
놓칠 수 없는 데이터를 수집할 수 있는 기회일 수 있음

2. 스노우볼 샘플링
연구원은 작은 그룹과 초기 접촉을 한다
이 응답자들은 네트워크에서 다른 사람들을 소개한다(예: Bryman(1999)의 디즈니 테마 파크 방문자 샘플)

 

3. 할당량 샘플링
시장 조사 및 여론 조사에 자주 사용됨
상대적으로 저렴하고 신속하며 관리가 용이함
모집단의 사회적 범주(계층)를 비례적으로 대표함
각 층의 단위에 대한 비랜덤 샘플링
면접관은 각 범주에 대한 할당량에 맞는 사람을 선택하므로 표본이 친근하고 접근하기 쉬운 것으로 보이는 사람들(예: 거리에서)에게 편향되어 접근하기 어려운 그룹의 대표성이 부족할 수 있다

 

일반화의 한계

결과는 샘플이 선택된 모집단으로만 일반화할 수 있습니다
지역적인 측면에서 지나치게 일반화하는 것을 경계하라

시간, 과거 사건 및 코호트 효과
결과가 더 이상 관련이 없을 수 있으므로 업데이트(복제)가 필요합니다

 

Key points

확률 표본 추출은 표본 선택에서 편향을 줄이기 위한 메커니즘이다.

랜덤하게 선택된 표본은 모집단에 대한 일반화를 허용하고 특정한 알려진 특성을 가집니다.

표본 크기가 커질수록 표본 오차는 감소합니다.

할당량 샘플은 일부 결함이 있지만 랜덤 샘플에 대한 합리적인 대안을 제공할 수 있습니다.

편의성 샘플은 흥미로운 데이터를 제공할 수 있지만 일반화 측면에서는 한계가 있다.

표본추출과 표본추출 관련 오류는 사회조사 연구에서 오류의 두 가지 원인일 뿐이다.

반응형

댓글