Order Statistics, 순서통계량
Order Statistics, 순서 통계량$(X_1, \dots, X_n)$이 i.i.d.한 분포에서 추출한 확률변수하고 하자. 많은 경우에, 우리는 확률변수의 값이 아니라 확률변수의 순서에 관심이 있을 때가 있다. 이런 경우 아래와같이 $1$번째부터 $n$번째 확률변수를 나열하면 다음과 같다.\[ X_{(1)}, \dots X_{(n)} \]$X_{(i)}$를 $i$번째 작은 확률변수이고, 당연히 $X_{(1)} \le X_{(2)} \le \cdots \le X_{(n)}$ 이다. 특별히, 표본 중앙값(sample median, median과는 다르다)은 $X_{(\left[ \frac{n}{2} \right])}$ 이다. Note: 중앙값(median, $m$)의 정의는 cdf $F$에 대하여, ..
2023. 3. 29.
다항분포, Multinomial Distribution
Multinomial Distribution, 다항분포categorical variable에 대한 모델링에 유용한 분포다. $k$개의 범주(category)가 있고, $s$개의 반응(response)에 대하여 $P(s=i)=\theta_i$로 표기할 수 있다.$X_i$는 $n$개의 반응(response) 중에서 $s=i$인 반응의 개수이다. $(X_1, X_2, \dots, X_n) \sim \text{Multinomial}(n, \theta_1, \theta_2, \dots, \theta_k)$ \[ p(x, \dots, x_n) = \dbinom{n}{x_1\dots x_k}\theta_1^{x_1} \cdots \theta_k^{x_k} = \cfrac{n!}{x_1! \times \cdots \t..
2023. 3. 23.