728x90
반응형

두 확률변수의 관계를 나타내는 공분산(covariance)에 대해 알아보자.
Covariance, 공분산
두 확률변수의 기댓값을 각각 라 할 때, 공분산은 다음과 같이 정의한다.
위 식을 전개하여 정리하면, 다음과 동일한 식을 얻을 수 있다.
Note: 공분산의 값의 범위는이다.
Note: 공분산은 두 확률변수의 선형 관계(linear relationship)만 파악할 수 있다.
Note:이다.
Linearlity of covariance, 공분산의 선형성
세 확률변수와 두 실수 에 대하여 다음이 성립한다.
Note: 분배법칙과 비슷하게 계산한다고 생각한다.
Example
두 확률변수가 독립이면, 이다.
Note: 역은 성립하지 않는다.
두 확률변수
반응형
확률변수의 합의 분산
두 임의의 확률변수, 에 대하여 개의 확률변수의 합으로 확장하면
만약 두 확률변수가 서로 독립이면개의 확률변수가 서로 독립이면
만일, 두 확률변수
즉 paired-comparison problem이 two-sample test의 분산보다 작다는 것이다.
두 확률변수가 독립이 아니라면 함부로
특히 두 집단의 표본평균 추정에서 독립이라는 가정이 없다면, 곧바로 각 확률변수의 분산의 합을 적용해서는 안된다.
다항분포(Multinomial distribution)의 공분산
다항분포에서
직관적으로 생각하면, 어떤 범주의 양이 많아지면 다른 범주의 갯수는 작아지므로 음수일 것이다.
이제 식으로 공분산을 직접 구해보자.
한편
여기서
위 식에서
그리고 각
따라서 다항분포의 공분산은 항상 음수다.
상관관계
Correlation, 상관관계
두 확률변수의 상관관계는 다음과 같이 정의한다.
Note: 상관관계의 범위는이다.
Note: 공분산의 두 확률변수의 scale을 정규화 한 값으로 생각할 수 있다.
Correlation of Bivariate Normal Distribution (이변량 정규분포의 상관관계)




728x90
반응형
'스터디 > 확률과 통계' 카테고리의 다른 글
조건부 기댓값과 조건부 분산, Conditional Expectation, Conditional Variance, Double Expectation, Law of Total Variance (0) | 2023.04.09 |
---|---|
적률 생성 함수, Moment Generating Function (MGF) (0) | 2023.04.05 |
분산, Variance (0) | 2023.03.30 |
연속확률변수의 기댓값, Expectation of Continuous Case (Uniform, Exponential, Gamma, Normal) (0) | 2023.03.30 |
Order Statistics, 순서통계량 (0) | 2023.03.29 |