[Data Science] 상관계수, Pearson, Spearman, Kendall
상관 계수한국어 위키백과) 두 변수 사이의 통계적 관계를 표현하기 위해 상관관계의 정도를 수치적으로 나타낸 계수.여러 유형의 상관 계수가 존재하고, 모두 $[-1, 1]$의 범위를 갖는다. $\pm 1$은 강한 상관성을, $0$은 상관성이 없다는 뜻이다.가장 중요한 유의점으로, 상관계수가 큰 것이 인과관계를 나타내지 않는다. (인과 관계를 알아내기 위해서는 보다 복잡한 과정이 필요하다. 추후 설명할 예정)Pearson's r, PCC(Pearson's Correlation Coefficient)두 확률변수 $X, Y$에 대하여 선형적(linear) 상관관계를 측정한다. 모집단(population)을 알 때의 상관계수와 표본에서의 상관계수의 정의가 다르다.우선, 모집단 상관계수는\[ \rho_{X, Y} ..
2023. 3. 17.