[ml] 분산분석(anova)

Anova ( 분산 분석 )

  1. 일원분산분석
  • 정의

    • 표본의 분산에 대한 차이를 검정하는 방법은 카이제곱 검정과 F Test(F 검정)으로 구분된다.

    • 카이제곱 검정은 단일표본의 모집단이 정규분포를 따르며 분산을 미리 알고 있는 경우에 적용된다.

    • 그러나 통계 과정에서 이를 알고 있는 경우는 드물기 때문에 모집단을 알고 있지 않은 경우의 F Test를 중심으로 분석한다.

    • F Test는 두 표본의 분산에 대한 차이가 통계적으로 유의한가를 판별하는 검정기법이다.

    • 분산의 유의차 분석이기 때문에 var test로도 불린다.

      • 요인 제곱합 자유도 평균제곱 F값 p값
        회귀 SSR 1 MSR MSR / MSE p가 유의수준보다
        작으면 기각
        잔차 SSE n-2 MSE    
        SST n-1      
    • R2 = SSR / SSE ( 1에 가까울 수록 종속변수가 설명되는 양이 많아서 의미가 있다.)
    • F유의수준 ( 1, n-2 ) 검정을 따른다.
    • 파이썬에서 p-value 구하는 법 stats.f.sf(F값 ,1, n-2) ==> 0.05(유의수준)보다 작으면 기각

https://datacookbook.kr/77

참고 자료

https://datacookbook.kr/77

RiverZayden

RiverZayden

AI Data Scientist

댓글