적합도 검정 예제

이제 마지막 열을 추가합니다. 합계는 3입니다. 이것은 θ2 테스트 통계입니다. 먼저 설정과 적합성 테스트의 우수성이 적절한 이유를 지적합니다. 색상의 우리의 변수는 범주형입니다. 이 변수에는 6가지 수준이 있으며, 가능한 6가지 색상에 해당합니다. 우리는 우리가 계산 하는 M&M 모든 M&M의 인구에서 간단한 무작위 표본 될 것 이라고 가정 합니다 우리는 지금 특정 예에 대 한 chi-square 통계를 계산 합니다. 다음 분포가 있는 600개의 M&M 사탕의 간단한 무작위 표본이 있다고 가정합니다: 모든 범주의 관측값의 예상 수가 너무 작으면 카이 스퀘어 테스트가 부정확한 결과를 제공할 수 있으므로 대신 정확한 테스트를 사용해야 합니다. «작은»의 의미에 대해 토론하려면 작은 샘플 크기의 웹 페이지를 참조하십시오.

여기서, = 적합도 테스트 O= 관찰값 E= 예상 값 이번에는, 수작업으로 θ2 테스트 통계를 계산합니다. 다음 제목으로 차트를 만들고 열을 입력합니다: Pearson의 피팅 테스트 통계의 chi-square 우수성은 다음과 같습니다: 테스트 통계는 자유도c-1도의 카이스퀘어 랜덤 변수로 대략 분포됩니다. 이 테스트는 null 가설에서 큰 숫자 또는 큰 편차를 제외한 모든 것을 제외한 상대적으로 낮은 전력 (실제 효과를 감지 할 수있는 기회)을 가지고 있습니다 (모든 클래스는 우연히 해당 클래스에 있을 수 있는 관찰을 포함합니다). 적합도 테스트의 카이 스퀘어 선의 경우, 가설은 다음과 같은 형태를 취합니다. 적합도 테스트를 수행하는 데 필요한 널 및 대체 가설을 결정합니다. 엥겔스, W.R. 2009. 하디 – 웨인 버그 비율에 대한 정확한 테스트.

유전학 183: 1431-1441. 물론 G-test와 카이 스퀘어 테스트로 데이터를 분석한 다음 가장 흥미로운 결과를 제공하는 데이터를 선택해서는 안 됩니다. 즉, 바람을 피우고 있을 것입니다. 두 개 이상의 통계 기법을 시도하고 가장 낮은 P 값을 제공하는 기술을 사용할 때마다 거짓 긍정의 가능성이 높아지게 됩니다. 이러한 유형의 가설 테스트에서는 데이터가 특정 분포에 적합한지 여부를 결정합니다. 예를 들어 알 수 없는 데이터가 이항 분포에 적합하다고 의심할 수 있습니다. 카이스퀘어 검정(가설 테스트의 분포가 카이스퀘어임을 의미)을 사용하여 적합 여부가 있는지 확인합니다. 이 테스트에 대한 null 및 대체 가설은 문장으로 작성되거나 방정식 또는 부등식으로 명시될 수 있습니다. 이 문제는 멀리 서쪽 미국 가족 분포가 미국 가족의 분포에 맞는지 여부를 테스트하도록 요청합니다. 이 테스트는 항상 오른쪽 꼬리입니다.