p-value
-
P-Value, T-Test, Z-Test 설명Data Analysis 2023. 6. 27. 09:40
P-value (p값) P-value는 통계적 가설 검정에서 사용되는 중요한 개념입니다. p값은 귀무가설(null hypothesis)이 참일 경우, 표본 데이터가 관찰된 통계치보다 더 극단적인 값을 얻을 확률을 의미합니다. 예를 들어, p값이 0.05라면, 이는 귀무가설이 참일 경우, 표본 데이터가 관찰된 통계치 이상으로 극단적인 결과를 얻을 확률이 5%라는 것을 의미합니다. 일반적으로 p값이 특정 임계치(예: 0.05)보다 작을 경우, 귀무가설을 기각하고 대립가설(alternative hypothesis)을 수용합니다. T-Test (t 검정) T-Test는 두 집단의 평균이 통계적으로 유의하게 다른지를 판단하는데 사용되는 검정 방법입니다. t검정은 일반적으로 다음과 같은 세 가지 유형으로 나눠집니다..
-
데이터과학을 위한 통계 리뷰 - 12일차 (복습과정,예제문제,분포)Machine Learning/데이터과학을 위한 통계 2021. 3. 12. 11:35
실제 p값 구하기 모의 실험 - 1 1개 표본 : 동전을 80번 돌렸을 때 앞면이 나올 확률 -> 125개 표본 추출 모의 실험 - 2 F통계량 예제 (ANOVA (ANalysis Of VAriance; 분산 분석)분산분석 3가지 조건정규성 : 각각의 그룹에서 변인은 정규분포.분산의 동질성 : Y의 모집단 분산은 각각의 모집단에서 동일.관찰의 독립성: 각각의 모집단에서 크기가 각각인 표본들이 독립적으로 표집. 파이썬에서 One-way ANOVA 분석은 scipy.stats이나 statsmodel 라이브러리를 이용해서 할 수 있습니다. 일원분산분석(One-way ANOVA)종속변인은 1개이며, 독립변인의 집단도 1개인 경우. 한가지 변수의 변화가 결과 변수에 미치는 영향을 보기 위해 사용됩니다. 22명의 ..
-
데이터과학을 위한 통계 리뷰 - 8일차 (F통계량 & ANOVA, 카이제곱검정,데이터 과학과의 관련성,피셔의 정확검정)Machine Learning/데이터과학을 위한 통계 2021. 3. 8. 18:44
3.8.1 F통계량 & ANOVA 분산분석(Analysis of Variance, ANOVA) 1. One-way-ANOVA 일원배치분산분석 2. F통계량 3. Two-way-ANOVA 이원배치분산분석 3.8.1 F통계량책 : 잔차 오차로 인한 분산과 그룹 평균의 분산에 대한 비율 F통계량 = F-value 차이 / 불확실도 표본 평균 차이의 통계적 지표(즉, 본래적으로 T-value와 완전히 같은 의미) T-value 와의 차이는 그룹 간 차이 정도와 불확실도를 약간 변형한다. 예) 분모 : 두 표본그룹의 평균간 차이의 불확실도 -> 표본 내에서 퍼진 정도F-value는 계산한 ‘분산’ 의 비율을 척도로 이용한다. 표본 집단의 그룹 간 평균의 표준 편차란, 표본 평균의 표준편차, 즉, 표준 오차를 의미..