본문 바로가기
728x90
반응형

상관계수2

[Data Science] 상관계수, Pearson, Spearman, Kendall 상관 계수한국어 위키백과) 두 변수 사이의 통계적 관계를 표현하기 위해 상관관계의 정도를 수치적으로 나타낸 계수.여러 유형의 상관 계수가 존재하고, 모두 $[-1, 1]$의 범위를 갖는다. $\pm 1$은 강한 상관성을, $0$은 상관성이 없다는 뜻이다.가장 중요한 유의점으로, 상관계수가 큰 것이 인과관계를 나타내지 않는다. (인과 관계를 알아내기 위해서는 보다 복잡한 과정이 필요하다. 추후 설명할 예정)Pearson's r, PCC(Pearson's Correlation Coefficient)두 확률변수 $X, Y$에 대하여 선형적(linear) 상관관계를 측정한다. 모집단(population)을 알 때의 상관계수와 표본에서의 상관계수의 정의가 다르다.우선, 모집단 상관계수는\[ \rho_{X, Y} .. 2023. 3. 17.
시계열 데이터의 상관성 구하기 (time-series correlation) 서로 다른 시계열 데이터의 상관성을 어떻게 알 수 있을까?그리고 두 데이터의 길이가 다르다면?? 공통적인 주의사항으로, 상관관계를 인과관계로 해석해서는 안된다는 것임을 통계학 수업에서 많이 들어봤을 것이다.1. Pearson Correlation Coefficient (PCC, Pearson's r)통계 시간에 배우는 그 피어슨-상관계수 맞다.  \[ \rho_{X, \ Y} = \cfrac{\text{cov}(X, \ Y)}{\sigma_X \sigma_Y} = \cfrac{\mathbb{E}[XY] - \mathbb{E}[X] \mathbb{E}[Y]}{\sqrt{\mathbb{E}[X^2] - (\mathbb{E}[X])^2} \sqrt{\mathbb{E}[Y^2] - (\mathbb{E}[Y])^.. 2023. 2. 12.
728x90
반응형