[Mathematical Statistics with Applications 7th Edition, Wackerly, Mendenhall, Scheaffer]
가설검정
10.1 Introduction
가설검정(Hypothesis testing)은 관측에 반하는 이론을 검증하는 모든 영역에서 행해진다. 가설검정은 관찰된 표본과 이론을 비요하여 의사결정을 내리는 것을 요구한다. 어떤 경우에 가설을 폐기해야하는가? 수용한다면? 잘못된 결정을 내릴 확률은? 이러한 질문들에 대한 답을 배울 것이다.
10.2 Elements of a Statistical Test
가설검정의 요소
검정 통계량(Test statistic): 통계적 결론에 기반한 표본에 대한 함수
기각역(Rejection region, RR): 귀무가설이 기각되고 대립가설이 채택되는 검정통계량의 값들
1종 오류(type I error):
2종 오류(type II error):
Example 10.1
이는 우리가 정한 기각역 RR이 매우 적은 리스크(0.004)로 jones가 승자임에도 질 것이라고 예측할 리스크가 적다는 뜻이다.
Example 10.4
예제 10.1의 상황에서 기각역을 RR = {
예제를 보다시피, 기각역이 넓어지면
어떻게 하면
10.3 Common Large-Sample Tests
검정 통계량:
RR = {
만일
Example 10.5
한 대기업의 영업 담당 부사장은 영업 사원들이 15건(주당 계약건) 이하의 계약을 한다고 주장한다. (부사장은 이 숫자를 늘리고 싶어한다.) 그의 주장을 확인하기위해,
부사장의 주장은
따라서
위에서는 upper-tail alternative의 경우만 보았지만, lower-tail alternative, two-tailed alternative도 존재한다.

Example 10.7
심리학 실험에서 남자와 여자에 대한 자극에 대한 반응시간을 조사했다. 독립 표본으로 50명의 남성과 50명의 여성이 실험에 참여했고 그 결과는 아래 표와 같다.

그러므로 우리는 양측검정(two-sided alternative)을 할 것이다.
10.4 Calculating Type II Error Probabilityes and Finding the Sample Size for Z Tests
다시
Example 10.8
예제 10.5의 상황에서 가설을 다음과 같이 가정했다고 하자.
이를 전개하면
따라서

반대로,

Example 10.8
예제 10.5에서 부사장은 다음과 같이 가설을 검증하려고 한다.
모분산이 9일때, 이 정확도를 유지하는 표본의 개수(sample size)를 구하시오.
따라서
10.5 Relationships Between Hypothesis-Testing Procedures and Confidence Intervals
신뢰계수가
(이때
large-sample에서,
이때
이는
Exercise 10.21, 10.45
(10.21) 두 종류의 토양의 압축실험에서 얻은 전단강도(shear strength)에 대한 데이터는 아래와 같을 때, 1% 유의수준에서 평균 강도는 다르다고 할 수 있는가?

주장하는 가설이 평균이 다르므로,
(10.45 - a) 두 토양의 전단강도 평균의 차에 대한 99% 신뢰구간을 구성하려고 한다.
(10.45 - b) 신뢰구간에 기반하여, 10.21에서 언급된 귀무가설은 기각될 수 있는가?
(10.45 - c) 10.21의 결론과 이번의 결론을 비교하라.
99%의 신뢰구간은
10.6 Another Way to Report the Results of a Statistical Test: Attained Significance Levels, or p-Values
획득된 유의수준, p-value, p-값
앞서 보았듯이, 1종오류의 확률
일단 Y나 Z와 같은 검정통계량이 결정되면, p-value 또는 유의확률을 보고하는 것이 일반적이다. 이 값들은 귀무가설이 기각되는 가장 작은
p-value는 귀무가설이 기각될 수 있는 가장 작은의 값이다.
p-value가 작을 수록, 귀무가설을 기각해야한다는 증거가 설득력을 갖는다. p-value가 당신을 설득하기 충분히 작다면, 당신은 귀무가설을 기각해야한다.
p-value는 귀무가설을 기각할 수 있는
어떤 의미에서, p-value는 데이터가 귀무가설과 일치하는지에 대한 평가로 간주될 수 있다.
p-value를 찾는 과정은 다음 예제처럼 따른다.
Example 10.10
예제 10.1~10.4에서 논의된 정치인 여론조사를 떠올려보자. (
따라서
Excercise 10.56
어떤 제약회사에서 감기가 발병한 후 나타나는 합병증과 회복 평균 시간(단위: 일)을 비교하는 실험을 진행했다. 이 실험은 비타민C를 복용/복용하지 않은 집단 2개로 나눠서 진행하였고, 35명의 성인을 임의로 선택하였다.

(a) 데이터는 비타민C 복용이 회복시간 단축을 했다고 볼 수 있는가? 획득된 유의수준을 구하여라.
(b) 만약 회사가
따라서 p-value =
10.7 Some Comments on the Theory of Hypothesis Testing
생략
10.8 Small-Sample Hypothesis Testing for and
이다. (자유도가
t분포 역시 대칭적이기 때문에 Z-test처럼 기각역을 RR = {


Example 10.14, 10.15
데이터가 아래와 같을 때,

합동표본분산을 구하면
따라서
또한 p-value는
Exercise 10.77
연습문제 8.90에서봤던, 공학계열과 어문계열 진학을 희망하는 학생들의 SAT 점수 데이터이다.

(a) verbal 점수에서 공학계열과 어문계열 진학 집단의 평균의 차이가 있다는 충분한 근거가 있는가? 유의수준
(a - solution)
(b) 연습문제 8.90(신뢰구간 구하기)와 (a)의 결론이 같은가?
(b - solution) 신뢰구간 CI는
(c, d) Math에서도 (a)와 동일한 검정을 하여라.
따라서 p-value는 0.1보다 크고 0.2보다 작다. 귀무가설을 기각할 수 없다. (귀무가설을 채택한다)
10.9 Testing Hypothesis Concerning Variances
모분산 검정



Example 10.16, 10.17
어떤 외사는 기계 엔진 부품을 생산하는데, 지름의 분산은 0.0002(인치) 보다 크지 않아야 한다고 한다. 10개의 랜덤샘플의 표본분산은 0.0003이라고 한다. \
(10.16) 5% 유의수준에서, 가설을 검정하라.
(10.17) p-value를 구하여라.
지름의 분포를 정규분포를 따른다고 가정한다면, 통계량은

Example 10.18
어떤 학자는 그의 실험 관측의 표준편차가
분산검정이므로 검정통계량은 카이제곱인
카이제곱분포표를 이용하면
다음은, 2개의 정규분포에서 추출된 경우에서 분산을 검정해보자.
우리의 가설은
표본분산
확률변수 F는
귀무가설

Example 10.19, 10.20
예제 10.16에서 살펴본 어떤 회사에서 생산한 부품의 지름에 대한 분산을 비교하려한다.
(10.19)
가설을 세우면
검정통계량은
(10.20) p-value를 구하여라
자유도가 (9, 19)인 F분포표를 보면

만일
만일
Example 10.21
다음은 남녀에 대한 전기자극에 대한 고통의 역치 데이터이다.

표본분산은 여성이 더 크므로 1은 여성, 2는 남성의 데이터로 표기한다.
검정통계량은
양측검정이므로
F가 기각역에 존재하지 않기 때문에 남녀 분산의 차이가 있다고 충분한 근거가 되지 않는다.
자유도가 (9, 13)인 F분포표에서
카이제곱검정과 F검정 모두 정규분포라는 가정하에 예민하게 이루어진다. 즉, t검정과 달리, 정규분포라는 가정이 없다면 카이제곱검정과 F검정은 not robust하다.
10.10 Power of Tests and the Neyman-Pearson Lemma
이번 장에서는 좀 더 이론적인 가설검정으로 들어간다. 앞에서 몇가지 가설검정의 방법을 배웠지만 왜 이렇게 해야하는지를 배울 차례이다.
좋은 검정은
반대로, 2종오류를 범할 확률을 구하면
여기서 검정력(Power)와

이상적인 경웨, 가설은
고정된 표본크기일 때

논의를 진행하기 전에, 우리는 단순가설(simple hypothesis)과 복합가설(composite hypothesis)를 정의해야한다.
그리고 가설
반대로, 가설
모수가인 분포에서 랜덤샘플을 추출했을 때,
어떤 가설이 확률분포를 하나로 결정하면 단순가설(simple hypothesis)이라고 하고,
그렇지 않은 경우(단순가설이 아니면) 복합가설(composite hypothesis)라고 한다.
예를 들어,
이때
만약에 분산이 알려져있지 않다면, 이때의 가설
두개의 단순가설을 검정한다고 하자.
두개의
네이만-피어슨 정리(The Neyman-Pearson Lemma)
모수가
Example 10.22
Example 10.23
가설을
따라서
양변에 자연로그를 취하면
따라서 RR = {
식을 살펴보면,
10.11 Likelihood Ratio Tests
10.12 Summary
'스터디 > 확률과 통계' 카테고리의 다른 글
[확률] 생일문제 (0) | 2023.03.02 |
---|---|
[확률] 베이즈 정리 (Bayes' theorem) (0) | 2023.02.18 |
Chapter 9. Properties of Point Estimators and Methods of Estimation (0) | 2022.08.13 |
Chapter 8. Estimation (0) | 2022.08.05 |
Chapter 4. Continuous Variables and Their Probability Distributions (0) | 2022.07.30 |