728x90

통계 4

[독서노트] 빅데이터를 지배하는 통계의 힘

이 책을 처음 알게된 것은 여의도 KBS에서 잠깐 일하고 있던 때이다. 같은 부서 분에게 데이터 분석 분야에 관심이 많다고 했더니 데이터 분석을 하시는 분을 소개시켜주셨다. 나는 이것저것 물어보기 위해 질문거리를 한아름 들고 찾아갔고 많은 이야기를 나누었다. 그리고 추천도서를 물었을 때 알려주셨던 도서를 드디어 읽게 되었다. 이 책은 통계의 필요성과 중요성을 알려주는 책이라 이 분야에 대해 입문하는 사람들에게 도움이 될 것 같다. “읽기, 쓰기 능력과 마찬가지로 통계학적 사고 역시 장차 사회인이 갖춰야 할 기본교양이 될 것이다.” - 1903년 H. G. 웰스 이 책에서 "통계학"은 이렇게 정의한다. * 통계학 : 집단현상을 수량적으로 관찰하고 분석하는 방법을 연구하는 학문. 그렇다면 통계학은 언제 실제..

독서노트 2020.08.30

[Python] 대응 2표본 검정(Paired test) - (1)

♪ 대응 2표본 검정 - (1) Paired t-test - (2) Wilcoxon's signed rank test ※ 대응표본(paired sample) - 두 모집단으로부터 표본을 각각 추출할 때 표본 각각의 인자가 서로 대응되는 표본 - 사전(pre)과 사후(post)를 비교할 때 주로 사용한다. 만약에 이런 질문을 받았다고 생각해보자. "다이어트 프로그램이 체중 감량하는데 효과가 있다는 것을 증명해봐!" 이런 상황일 때 대응 2표본 검정을 실행시키면 된다. 모집단 A(Pre) 와 모집단 B(Post)가 있다고 가정하자. 각 모집단에는 인자들이 있을 것이고 서로 대응한다. 예를 들어, 다이어트 프로그램을 하기 전(Pre)과 후(Post) 라고 정하였다. 귀무가설은 "다이어트 프로그램을 하기 전의 ..

[Python] 일표본 t 검정(One sample t-test)

일표본 t 검정을 공부하기에 앞서 가설검정에 대해 알아보겠다. ※ 가설검정이란? 모집단에 대한 입장(주장)에 대해 표본을 추출하여 수집된 데이터에 근거하여 그 입장(주장)이 맞다고 할 수 있는지를 통계적으로 검정하는 것이다. 가설에는 "귀무가설" 과 "대립가설" 이 있다. 귀무가설(歸無假說; Null hypothesis) : 모집단에 대한 기존의 생각(입장) 대립가설(對立假說; alternative hypothesis) : 귀무가설과 다른 새로운 생각(입장) 표본의 데이터를 근거로 귀무가설과 대립가설 중에서 하나를 선택하는 과정이 가설검정이다. import scipy.stats as stats # 분석에 필요한 라이브러리 ♪ 일표본 t 검정(One sample t-test) - 한 개의 모집단을 이루고 ..

유의수준 + 유의확률(p-value)

통계에서 가설의 종류는 귀무가설(Null Hypothesis)이 있고 대립가설(Alternative Hypothesis)이 있다. 귀무가설 영가설(零假說) 이라고도 불리며, 별 차이가 없는 경우의 가설이다. 대립가설 귀무가설과는 다른 가설을 주장한다. p-value(유의확률) 귀무가설을 기각할 수 있는 최소한의 유의 수준이다. 유의 수준 : 귀무가설 또는 대립가설의 기준점 유의 수준 > p-value 이면 대립 가설을 채택 유의 수준 < p-value 이면 귀무 가설을 유지