ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • P-Value, T-Test, Z-Test 설명
    Data Analysis 2023. 6. 27. 09:40
    반응형

    P-value (p값)

    P-value는 통계적 가설 검정에서 사용되는 중요한 개념입니다. p값은 귀무가설(null hypothesis)이 참일 경우, 표본 데이터가 관찰된 통계치보다 더 극단적인 값을 얻을 확률을 의미합니다.

    예를 들어, p값이 0.05라면, 이는 귀무가설이 참일 경우, 표본 데이터가 관찰된 통계치 이상으로 극단적인 결과를 얻을 확률이 5%라는 것을 의미합니다. 일반적으로 p값이 특정 임계치(예: 0.05)보다 작을 경우, 귀무가설을 기각하고 대립가설(alternative hypothesis)을 수용합니다.

     


    T-Test (t 검정)

    T-Test는 두 집단의 평균이 통계적으로 유의하게 다른지를 판단하는데 사용되는 검정 방법입니다. t검정은 일반적으로 다음과 같은 세 가지 유형으로 나눠집니다:

    독립 표본 t 검정 (Independent samples t-test): 두 독립적인 그룹의 평균을 비교할 때 사용됩니다.
    대응 표본 t 검정 (Paired samples t-test): 같은 그룹이나 유닛에서 두 번의 측정값을 비교할 때 사용됩니다. 예를 들어, 치료 전과 후의 차이를 비교하는 경우입니다.
    단일 표본 t 검정 (One-sample t-test): 표본 집단의 평균이 특정 값과 유의하게 다른지를 판단할 때 사용됩니다.

     

     

    Z-Test (z 검정)

    Z-Test는 t-Test와 유사하게 두 집단의 평균이 통계적으로 유의하게 다른지를 판단하는데 사용됩니다. 그러나 z-Test는 표본 크기가 충분히 클 때 (보통 30 이상) 또는 모집단의 표준 편차가 알려져 있을 때 사용됩니다.

    t-Test와 z-Test의 주요 차이점은 t-Test는 모집단의 표준 편차가 알려져 있지 않고 표본 크기가 작을 때 사용되며, z-Test는 모집단의 표준 편차가 알려져 있거나 표본 크기가 큰 경우에 사용됩니다.

    모든 통계 검정에서는 해당 검정의 가정이 충족되는지 확인하는 것이 중요합니다. 예를 들어, t-Test는 데이터가 정규 분포를 따르고, 각 그룹 내에서 독립적이며, 그룹 간의 분산이 동일하다는 가정 등이 필요합니다. z-Test 역시 비슷한 가정을 필요로 하며, 추가로 모집단의 표준 편차가 알려져 있거나 표본 크기가 충분히 크다는 가정이 필요합니다. 이러한 가정들이 충족되지 않을 경우, 검정의 결과는 신뢰할 수 없게 됩니다.

     


    P-value는 통계적 가설 검정에서 귀무가설(null hypothesis)을 기각할지 여부를 결정하는 데 사용되는 값입니다. 그것은 특정 통계적 모델이 주어졌을 때, 관찰된 데이터 또는 더 극단적인 데이터가 발생할 확률을 나타냅니다.

    일반적으로 통계적 가설 검정은 다음과 같은 두 가설을 세우는 과정에서 시작됩니다:

    귀무가설 (Null Hypothesis, H0): 연구자가 검증하려는 초기 가설입니다. 일반적으로 변화가 없거나, 효과가 없는 상황을 나타냅니다. 예를 들어, '두 그룹 간의 평균에 차이가 없다'가 될 수 있습니다.
    대립가설 (Alternative Hypothesis, H1): 연구자가 증명하려는 가설입니다. 귀무가설과 반대의 상황을 나타냅니다. 예를 들어, '두 그룹 간의 평균에는 차이가 있다'가 될 수 있습니다.
    이제 P-value에 대해 이해하려면, 표본 데이터를 사용하여 통계량(예: 평균 차이)을 계산하고 이를 통해 p-value를 얻는 과정을 이해해야 합니다. p-value는 표본 데이터를 통해 계산된 통계량이 귀무가설을 따르는 분포에서 나올 확률을 의미합니다.

    예시:

    새로운 약이 실제로 효과가 있는지를 검증하기 위해 임상실험을 진행했다고 가정합시다. 이 경우 귀무가설은 "약은 효과가 없다"가 되고, 대립가설은 "약은 효과가 있다"가 됩니다. 여기서 약의 효과를 측정하는 방법은 환자의 건강 상태 개선 여부일 수 있습니다.

    실험을 통해 얻은 데이터를 가지고 통계량(예: 약을 복용한 그룹과 플라시보 그룹의 평균 건강 상태 차이)을 계산하고, 이 통계량이 귀무가설 하에서 얼마나 자주 발생하는지를 계산합니다. 이 확률이 바로 p-value입니다.

    예를 들어, p-value가 0.03이라면, 이는 귀무가설이 참일 경우 (즉, 약이 실제로 효과가 없을 경우), 관찰된 통계량(즉, 약을 복용한 그룹과 플라시보 그룹의 건강 상태 차이) 또는 더 극단적인 통계량이 나타날 확률이 3%라는 것을 의미합니다.

    이는 귀무가설이 참일 경우에도 우리가 관찰한 결과와 같은 결과, 또는 더 극단적인 결과가 나타날 확률이 매우 낮다는 것을 의미합니다. 따라서, 이런 경우에는 귀무가설을 기각하고 대립가설을 받아들이는 것이 일반적입니다.

    그런데 이 때 주의할 점은 p-value가 0.03이라는 것이 '약이 효과가 있다'는 것을 97% 확신할 수 있다는 의미는 아니라는 것입니다. p-value는 '약이 효과가 없다'는 귀무가설이 참일 경우에 관찰된 결과 또는 더 극단적인 결과가 나타날 확률을 나타내는 것으로, 이를 통해 귀무가설을 기각하는 결정을 내릴 수 있을 뿐입니다.

    이와 같이 p-value는 귀무가설의 참/거짓을 결정하는 것이 아니라, 우리의 데이터가 귀무가설과 얼마나 잘 맞는지를 평가하는 데 사용되는 도구라는 점을 명심해야 합니다.

    반응형
Designed by Tistory.