본문 바로가기
728x90
반응형

전체 글266

[Linux] [conda] 내가 자주 사용하는 리눅스, conda 명령어 conda list conda 환경에 설치된 모든 패키지 이름 출력 $ conda list # packages in environment at /APP/DeepLn/Anaconda3-2020.02: # # Name Version Build Channel _anaconda_depends 2020.07 py37_0 _ipyw_jlab_nb_ext_conf 0.1.0 py37_0 . . . $ conda list ^jupyter conda 환경에 설치된 jupyter로 시작하는 패키지 이름 출력 $ conda list ^jupyter # packages in environment at /APP/DeepLn/Anaconda3-2020.02: # # Name Vers.. 2023. 4. 8.
[Data Science] Grubb's test를 이용한 Outlier detection 가정정규분포를 따르는 표본(sample)은 이상치(outlier)를 갖지 않을 것이다. 검정 방법통계량 $G$를 다음과 같이 정의하여 $G > G_{ref}$이면 이상치가 존재한다고 판단한다.$x_i$는 표본(sample), $\bar{x}$는 표본평균(sample mean), $s$는 표본표준편차(sample/empirical standard deviation)일 때 $G$는\[ G = \cfrac{\displaystyle\max_{1 \le i \le n}|x_i - \bar{x}|}{s} \] 유의수준 $\alpha$에 대하여 아래 부등식을 만족하면 "정규분포에서 추출된 표본은 이상치를 갖지 않는다"를 "기각"한다.\[ G > \cfrac{n-1}{\sqrt{n}}\sqrt{\cfrac{t^2_{1.. 2023. 4. 8.
[경제용어] 매파와 비둘기파 (hawkish and dovish) 매와 비둘기의 뜻은?경제학에서, "매파"와 "비둘기파"라는 용어는 중앙 은행이나 정부가 통화 정책에서 취할 수 있는 두 가지 주요 접근 방식을 설명하기 위해 사용됩니다."매파"의 입장은 통화 정책이 더 엄격한 것으로 특징지어지는데, 이는 중앙은행이나 정부가 경제 성장을 촉진하는 것보다 인플레이션을 통제하는 것에 더 관심이 있다는 것을 의미합니다. 이것은 일반적으로 금리를 인상하거나 통화 공급을 줄이거나 차입을 더 비싸게 만들고 경제 활동을 둔화시킬 수 있는 다른 조치를 취하는 것을 포함합니다.반면에, "비둘기파"의 입장은 느슨한 통화 정책으로 특징지어지는데, 이는 중앙은행이나 정부가 인플레이션을 통제하는 것보다 경제 성장을 촉진하는 것에 더 관심이 있다는 것을 의미합니다. 이것은 일반적으로 금리를 낮추거.. 2023. 4. 7.
적률 생성 함수, Moment Generating Function (MGF) Moment Generating Function, 적률생성함수, mgf, MGF확률변수 $X$와 양수 $k$에 대하여, $k$번째 적률($k$-th moment of $X$)을 $E(X^k)$라고 한다.이때 적률생성함수(모멘트 생성 함수)는 다음과 같이 정의한다.\[ m_X(t) = E(e^{tx}) \]임의의 확률변수 $X$와 그 mgf를 $m_X(t) (\[ m_X^{(k)}(0) = E(X^k) \]특히, $m'_X(0) = E(X), \ m''_X(0) = E(X^2)$이다.$e^x = 1 + x + \cfrac{x^2}{2!} + \cfrac{x^3}{3!} + \cdots$ 에서$e^{tx} = 1 + tx + \cfrac{(tx)^2}{2!} + \cfrac{(tx)^3}{3!} + \cdo.. 2023. 4. 5.
[Data Science] Association Rule Mining (7) mlxtend로 association rule을 만들어보자 앞의 포스팅에서 배운 association rule mining 알고리즘을 mlxtend 패키지를 이용하여 활용해보자.pip install mlxtend TransactionEncoder()sklearn의 OneHotEncoder, LabelEncoder 등과 거의 유사한 Encoder 클래스이다.transaction data를 numpy array로 인코딩해준다.import pandas as pdfrom mlxtend.preprocessing import TransactionEncoderdataset = [['Milk', 'Onion', 'Nutmeg', 'Kidney Beans', 'Eggs', 'Yogurt'], ['Dill', 'Onion', 'Nutmeg', 'Kidney Be.. 2023. 4. 4.
[Data Science] Association Rule Mining (6) Interesting Measures Basketball과 Cereal을 각각 $B$, $C$라고 표기하자. 이때 rule의 sup과 conf를 튜플로 표기하면$B \to C$ = [40%, 66.7%] 이다. 그러나 실제 시리얼을 먹는 학생의 비율은 3750/5000=75%로 confidence보다 크다. 심지어 $B$ 없이도 $C$의 비율은 $P(C)=0.75$로 rule $B \to C$는 informative하지 않는다. 심지어 rule $B \to \neg C$ = [20%, 33.3%]는 sup과 conf 모두 낮지만, $P(\neg C | B) = 1750/2000$으로 확률의 측면에서 도 정확하다고 할 수 있다. (more informative) 즉, support와 confidence는 association에는 유용하지만, .. 2023. 4. 3.
728x90
반응형