728x90 반응형 variance3 단순선형회귀 (Simple Linear Regression Model) Simple Linear Regression (단순 선형회귀)Model Definition and Assumptions$n$개의 관측된 데이터 $(x_1, y_1), \dots, (x_n, y_n)$에 대하여 $x$와 $y$가 어떻게 연관되어있는지 알고싶다.특별히, 선형적 관계에 있는 모형을 설계할 수 있다.\[ y_i = \beta_0 + \beta_1 x_i + \epsilon_i \quad \epsilon_i \sim N(0, \sigma^2) \]$y$를 $x$에 따른 확률변수로 생각하여 다음과 같이 모형을 설계한다.\[ Y_i \sim N(\beta_0 + \beta_1 x_i, \sigma^2) \]※ $x$는 predictor/explanatory/independent variable로 불린.. 2024. 6. 2. 일원분류 분산분석 (One-Factor ANOVA) One-Factor Analysis of Variance (ANOVA)Analysis of Variance (ANOVA)모집단이 2개의 경우 모평균(또는 모비율)을 비교하는 방법을 다루었다.이제 모집단이 3개 이상인 경우에 대해 생각해보자.기본적인 아이디어는 통계적 분석(statistical analysis)이 같은지 확인하는 것이다. 여러개의 모집단에서 추출된 독립 표본의 집합을 completely randomized design(완전임의배치법)이라 한다.그리고 분산분석(analysis of variance, ANOVA)라는 통계적 방법론을 이용한다. 모집단이 2개인 경우, pair인지 independent인지 구분하여 검정하였다.모집단이 3개 이상인 경우에도 비슷한 방식으로 구분한다.첫번째는 bloc.. 2024. 6. 1. 분산, Variance 확률변수 $X$의 기댓값 $E(X)$를 구하는 법을 알았다.이제, $X$가 $E(X)$로부터 얼마나 멀리 떨어져 있는지에 대한 정보인 분산에 대해 알아보자. Variance, 분산\[ Var(X) = \sigma_X^2 = E\left[ (X - E(X))^2 \right] = E(X^2)-\mu^2 \]Standard Deviation, 표준편차\[ Sd(X) = \sqrt{Var(X)} = \sigma_X \]Note: 경우에 따라 $Var(X)$대신 $V(X)$를, $E(X)$대신 $\mu_X$로 표기할 수 있다.Note: 분산의 단위는 $X$의 단위의 제곱이다.Note: 표준편차의 단위는 $X$의 단위와 같다. (1) 이항분포의 분산$E(X)=n\theta$임을 알고 있으므로, $E(X^2)$을.. 2023. 3. 30. 이전 1 다음 728x90 반응형