P-value란? 유의 확률

통계적 가설 검정

Statistical Hypothesis Test(통계적 가설 검정)은 통계적 추론의 하나이다.

모집단 실제의 값이 얼마가 된다는 주장과 관련하여 표본의 정보를 사용하여 가설의 합당성 여부를 판정하는 과정이다.

간단하게 말하면 가설 검정 또는 가설 검증이라고 부르기도 한다.

통계적 가설 검정에서 유의 확률(Significance Probability, Asymptotic Significance) 또는 p-value(Probability Value)는 귀무 가설이 맞다고 가정할 때, 결과보다 극단적인 결과가 실제로 관측될 확률이다.

실험의 표본 공간에서 정의되는 확률 변수이며 0 ~ 1 사이의 값을 가진다.

p-value는 귀무 가설(Null Hypothesis)이 맞다는 전제 하에, 표본에서 실제로 관측된 통계치와 '같거나 더 극단적인' 통계치가 관측될 확률 이다.

즉 귀무 가설이 참이라는 가정 아래 얻은 통계량이 얼마나 귀무가설을 지지하는지 나타내는 확률이다.

즉, 귀무가설을 채택할지 기각할지를 판단할때 기준으로 p-value를 사용할 수 있다.

유의 확률 - 위키백과, 우리 모두의 백과사전

위키백과, 우리 모두의 백과사전. 양쪽 꼬리 유의 확률의 정의 오른쪽 꼬리 유의 확률의 정의 통계적 가설 검정에서 유의 확률(有意確率, 영어: significance probability, asymptotic significance) 또는 p-값(

ko.wikipedia.org

쉬운 P-value 이해: 어떤 사건이 우연히 발생할 확률이 얼마일까?

왜 P-value는 항상 0.05 보다 작아야 하는가? 유의 수준(Significant Level 5%) = 기각 역

P-value는 확률이므로 5%이며, 어떤 사건이 우연히 발생할 확률이 5%보다 작다는 의미가 된다.

즉, 우연히 발생할 가능성이 적으며 이유, 인과관계가 있다라고 해석할 수 있다.

작은 P-value를 얻게된다면 H0(귀무 가설)이 참일 확률이 적어진다.

5%부터 10%사이는 보통 주관적으로 판단한다.

PCA Dimensionality Reduction이란? PCA란? (1)	2022.11.10
Imbalanced Data in Classification, 분류에서 불안정한 데이터 (0)	2022.10.26
[Machine Learning] Bias-Variance Tradeoff (0)	2022.09.27
[머신러닝 시스템 디자인 스터디 Part5] Performance and Capacity Considerations (0)	2022.08.18
[머신러닝 시스템 디자인 스터디 Part5]Offline model building and evaluation (0)	2022.08.14