본문 바로가기
728x90
반응형

전체 글267

공분산과 상관계수, Covariance and Correlation 두 확률변수의 관계를 나타내는 공분산(covariance)에 대해 알아보자.Covariance, 공분산두 확률변수 X,Y의 기댓값을 각각 μX,μY라 할 때, 공분산은 다음과 같이 정의한다.Cov(X,Y)=E[(XμX)(YμY)]위 식을 전개하여 정리하면, 다음과 동일한 식을 얻을 수 있다.Cov(X,Y)=E(XY)E(X)E(Y)Note: 공분산의 값의 범위는 (,)이다.Note: 공분산은 두 확률변수의 선형 관계(linear relationship)만 파악할 수 있다.Note: Cov(X,X)=Var(X) 이다. Linearlity of covariance, 공분산의 선.. 2023. 3. 31.
분산, Variance 확률변수 X의 기댓값 E(X)를 구하는 법을 알았다.이제, XE(X)로부터 얼마나 멀리 떨어져 있는지에 대한 정보인 분산에 대해 알아보자. Variance, 분산Var(X)=σX2=E[(XE(X))2]=E(X2)μ2Standard Deviation, 표준편차Sd(X)=Var(X)=σXNote: 경우에 따라 Var(X)대신 V(X)를, E(X)대신 μX로 표기할 수 있다.Note: 분산의 단위는 X의 단위의 제곱이다.Note: 표준편차의 단위는 X의 단위와 같다. (1) 이항분포의 분산E(X)=nθ임을 알고 있으므로, E(X2)을.. 2023. 3. 30.
연속확률변수의 기댓값, Expectation of Continuous Case (Uniform, Exponential, Gamma, Normal) 연속확률변수의 기댓값도 이산확률변수와 거의 같다.Expected value, 기댓값연속확률변수 X에 대히여 pdf가 fX일 때, X의 기댓값은 다음과 같다,E(X)=xfX(x)dx(1) 균등분포의 기댓값XU[a,b]의 pdf는 1ba이므로 기댓값은E(X)=abxbadx=a+b2 (2) 지수분포의 기댓값XExp(λ)의 pdf는 λeλx이므로 기댓값은 (부분적분을 이용하여)\[ E(X) = \int_0^{\infty}x \lambda e^{-\lambda x} = \lef.. 2023. 3. 30.
Order Statistics, 순서통계량 Order Statistics, 순서 통계량(X1,,Xn)이 i.i.d.한 분포에서 추출한 확률변수하고 하자. 많은 경우에, 우리는 확률변수의 값이 아니라 확률변수의 순서에 관심이 있을 때가 있다. 이런 경우 아래와같이 1번째부터 n번째 확률변수를 나열하면 다음과 같다.X(1),X(n)X(i)i번째 작은 확률변수이고, 당연히 X(1)X(2)X(n) 이다. 특별히, 표본 중앙값(sample median, median과는 다르다)은 X([n2]) 이다. Note: 중앙값(median, m)의 정의는 cdf F에 대하여, .. 2023. 3. 29.
이산확률변수의 기댓값, Expectation of Discrete Case (Bernoulli, Binomial, Geometric, Poisson) 앞서 Ch2에서 확률변수와 확률분포를 배웠다. 이제 유의미한 통계량인 기댓값에 대하여 Ch3를 할애했다.그리고 기댓값을 시작으로 분산, 공분산, 상관계수를 학습하고 적률생성함수(moment generating function, mgf)로 k차 적률(E(Xk))까지 유도해본다. Expected value, 기댓값이산확률변수 X에 대하여, 기댓값을 E(X) 또는 μX로 표기한다. E(X)=xRxP(X=x)=xRxpX(x)pi=P(X=xi)로 표기하면 다음과 같이 정의할 수 있다.E(X)=ixipiNote: 기댓값은 음수가 될 수 있다. Degene.. 2023. 3. 29.
[Data Science] Data Preprocessing (5) - Data Transformation Data Transformationattribute의 모든 값을 새로운 값으로 매핑하는 함수를 의미한다.Normalizationmin-max normalizationz-score normalizationDiscretization: concept of hierarchy climbingetc NormalizationMin-max normalization: [a,b]로 변환M=max(A), m=min(A)라 하면v=vmMm(ba)+a Z-score normalizationv=vμAσA Example다음과 같이 5개의 데이터에 대하여, 각 물음의 방법으로 normalize하여라.\[ 2.. 2023. 3. 28.
728x90
반응형