데이터 분석/통계(Statistics)

[Python] 대응 2표본 검정(Paired test) - (2)

Jerry Jun 2020. 8. 29. 15:40
728x90

♪ 대응 2표본 검정

 - (1) Paired t-test

 - (2) Wilcoxon's signed rank test

 

 

이전 게시물에서는 대응 2표본 t 검정(Paired t-test) 에 대해서 알아봤다.

하지만 정규성이 만족했을 때의 이야기이므로 이번에는 정규성 가정이 깨졌을 때를 이야기해보자.

 

 

Wilcoxon's signed rank test

사전(pre)과 사후(post)가 함께 있으니 두 집단처럼 보이지만 사전 - 사후 이니 결국 한 집단이다.

결국 D(difference) 만 본다면 일표본 검정과 같아진다.

그래서, 사전의 양적 자료와 사후의 양적 자료를 뺀 값이 정규성 가정을 만족하지 않을 때 사용한다.

 

 

 

[가설검정]

귀무가설 : 다이어트는 몸무게를 줄이는 것에 효과가 없다. (사전 몸무게 = 사후 몸무게)
대립가설 : 다이어트는 몸무게를 줄이는 것에 효과가 있다. (사전 몸무게 > 사후 몸무게)

 

 

1단계 : 정규성 검정

stats.shapiro(diet.difference)
--------------------------------
ShapiroResult(statistic=0.810143232345581, pvalue=0.026645243167877197)

diet.difference 는 before - after 한 값이다.

유의확률이 0.027 이므로 유의수준 0.05 에서

정규성 가정이 깨짐을 알 수 있다.

 

 

2단계 : Wilcoxon's signed rank test

stats.wilcoxon(diet.before, diet.after,
               zero_method = "wilcox",
               alternative = "greater")
---------------------------------------------
WilcoxonResult(statistic=42.0, pvalue=0.009765625)

검정통계량(w+) = 42.0

유의확률(p-value) = 0.01

 

유의확률이 0.01 이므로 유의수준 0.05 보다 작기 때문에

대립가설에 따라 다이어트는 몸무게를 줄이는 것에 효과가 있는 것으로 나타났다.

 

 

algorithm

 

* 실습출처 :  2020 AI 데이터분석 개발자과정 : 기초 통계 (이부일 CEO님)

300x250