본문 바로가기
728x90
반응형

p-value6

단순선형회귀 (Simple Linear Regression Model) Simple Linear Regression (단순 선형회귀)Model Definition and Assumptions$n$개의 관측된 데이터 $(x_1, y_1), \dots, (x_n, y_n)$에 대하여 $x$와 $y$가 어떻게 연관되어있는지 알고싶다.특별히, 선형적 관계에 있는 모형을 설계할 수 있다.\[ y_i = \beta_0 + \beta_1 x_i + \epsilon_i \quad \epsilon_i \sim N(0, \sigma^2) \]$y$를 $x$에 따른 확률변수로 생각하여 다음과 같이 모형을 설계한다.\[ Y_i \sim N(\beta_0 + \beta_1 x_i, \sigma^2) \]※ $x$는 predictor/explanatory/independent variable로 불린.. 2024. 6. 2.
일원분류 분산분석 (One-Factor ANOVA) One-Factor Analysis of Variance (ANOVA)Analysis of Variance (ANOVA)모집단이 2개의 경우 모평균(또는 모비율)을 비교하는 방법을 다루었다.이제 모집단이 3개 이상인 경우에 대해 생각해보자.기본적인 아이디어는 통계적 분석(statistical analysis)이 같은지 확인하는 것이다. 여러개의 모집단에서 추출된 독립 표본의 집합을 completely randomized design(완전임의배치법)이라 한다.그리고 분산분석(analysis of variance, ANOVA)라는 통계적 방법론을 이용한다. 모집단이 2개인 경우, pair인지 independent인지 구분하여 검정하였다.모집단이 3개 이상인 경우에도 비슷한 방식으로 구분한다.첫번째는 bloc.. 2024. 6. 1.
모비율 검정 (Inferences on Population Proportion, Two Population Proportions) Discrete Data Analysis: Population Proportion1.1 모비율의 추정 (Inferences on a Population Proportion)parameter $p$가 모집단의 비율(모비율)이라 하자. 모집단에서 $n$개의 관찰에 대한 무작위 표본을 얻은 경우, 각 관찰은 성공확률이 $p$인 베르누이 분포를 따른다.  따라서 성공횟수 $X$는 파라미터가 $n$과 $p$인 이항분포를 따른다. ($X \sim Bin(n, p)$) 전체 모집단에서 $n$개의 샘플을 얻고, 우리가 보고 싶은 특성이 있는/없는 두 범주(category)로 분리할 수 있다.각 샘플이 특성이 있는 확률이 $p$라 하고 전체 샘플 수를 $x$라 하자.sample proportion의 point estim.. 2024. 5. 18.
모평균 추정-모집단이 두개인 경우 (Comparing Two Population Means, Paired Samples, Independent Samples) Comparing Two Population MeansTwo Sample Problems이번 포스트에서는 두 모집단의 차이를 살펴볼 것이다.영어로는 two-sample problem이라 한다. 두 모집단 A, B가 있다고 하자.$x_1, \dots, x_n$은 A에서 얻은 데이터(observed data)이고, $y_1, \dots, y_m$은 B에서 얻은 데이터라 하자.수학적으로 $x_i$는 $F_A(x)$에서, $y_i$는 $F_B(x)$에서 추출된 샘플이라 할 수 있다.  두 모집단의 차이를 말할 때, $F_A(x), F_B(x)$의 차이를 구하면 되지 않느냐고 할 수 있다.그러나 $H_0: F_A=F_B \text{ vs. } H_A: F_A \neq F_B$ 이렇게는 하면 답이 없다.두 분포가 .. 2024. 5. 16.
모평균 가설 검정 (Hypothesis Tests of a Population Mean, t-test, z-test) Hypothesis testing, Null hypothesis, Alternative hypothesis, p-value통계적으로 다양한 가설을 세울 수 있다. (평균, 분산, model fitness 등)이 글에서는 모평균에 대한 가설과 그 검정방법을 소개한다.HypothesisNull Hypothesis ($H_0$, 귀무가설)초기에 설정하는 가설.효과가 없거나 차이가 없다는 주장을 담는다.Alternative Hypothesis ($H_A$, 대립가설)귀무가설과 대조(opposite)되는 가설.귀무가설이 틀렸다는 것을 보여주기 위해 사용된다.보통 대립가설이 "주장"이 되는 경우가 많다.모평균($\mu$)과 관련된 가설은 다음과 같이 세팅된다.two-sided set of hypothesis: $H.. 2024. 5. 9.
Testing Hypothesis and p-values Testing Hypothesis and p-value 이론, 추측, 가설 등에서는 $\theta$의 값에 대하여 관심이 있다. (보통 $\theta$에 대한 함수로 표현 가능하고 교재에서 $\phi(\theta)$라고 한다.) 주로 \[ H_0:\ \theta = \theta_0 \] 과 같이 표기하며 이를 null hypothesis라 한다. 이때 $\theta_0$는 데이터를 얻기 전에 어떤 값으로 특정되어야 한다. 이제 우위 $H_0$가 참일 때 관측된 데이터가 얼마나 unlikely한지 측정할 것이다. Note: $H_0$이 얼마나 likely한지 평가하는 것이 아니다. 얻은 데이터 $s$가 unlikely한지 평가하는 것이다. 만일 under $H_0$에서 데이터 $s$가 surprising하.. 2023. 5. 25.
728x90
반응형