본문 바로가기
728x90
반응형

전체 글263

자주 쓰이는 라틴 약어 (e.g., i.e 등) Introduction 필기를 하면서 예시를 쓸 때 ex) 이런식으로 많이 썼다. 예전에 영어학원에 다니면서 실제 영어권 국가에서 ex)는 안쓰고 e.g. 이렇게 사용한다고 강사님이 그러셨다. 곰곰히 생각해보니 전공책 원서에서도 ex)라고는 안쓰고 e.g., i.e. 이런식으로 써져 있는 것 같았다. 사실은 영어가 아니라 라틴어 약어인데, 이참에 자주 사용되는 단어를 정리해보았다. 또 너냐 라틴어!! A.D. (anno Domini) in the year of the Lord 번역하면 주님의 해(年) 이지만, 우리말로 기원후. 반대말인 BC는 사실 영어로 Before Christ이다. 요즘에는 종교적 다양성을 포함하기 위해(종교적 색채를 지우기 위해) 기원전은 BCE ( Before Current/Com.. 2023. 2. 18.
[pandas] [판다스] DataFrame 조작하기, MultiIndex 전에 만든 미국 5개주의 인구와 면적 데이터를 이용해보자. Transpose DataFrame은 2차원 배열로 취급하므로 전치행렬과 같은 transpose 연산이 가능하다. population_dict = { 'California': 38332521, 'Texas': 26448193, 'New York': 19651127, 'Florida': 19552860, 'Illinois': 12882135, } area_dict = { 'California': 423967, 'Texas': 695662, 'New York': 141297, 'Florida': 170312, 'Illinois': 149995, } states_T = pd.DataFrame([population_dict, area_dict], ind.. 2023. 2. 15.
[pandas] [판다스] 판다스 기초 pandas는 크게 3가지 Object로 구성되어있다. Index, Series, DataFrame Index object Series와 DataFrame은 index 객체를 포함하고있고, index를 바탕으로 데이터를 조작/변형할 수 있다. Series는 1개의 index를, DataFrame은 2개의 index(row index, column index)를 갖고 있다. Index는 immutable array이고 ordered set이다. multi-set이므로 repeated value를 가질 수 있다. ind = pd.Index([2, 3, 5, 5, 11]) print(ind) print(ind.size, ind.shape, ind.ndim, ind.dtype) ----- result -----.. 2023. 2. 15.
[NumPy] 넘파이 - 선형대수 numpy.linalg 모듈에 선형대수 관련 함수들이 있다. 내부적으로는 원래 선형대수 라이브러리인 BLAS와 LAPACK을 바탕으로 구현되어있다고 한다. (이 두 라이브러리를 사용하진 않았지만 아마 함수 이름이나 API가 같을 것으로 예상된다.) 또한 Scipy와도 많은 부분이 공통된 함수가 있는데, 일부 기능은 Scipy가 더 많이 가지고 있다. 예를 들어, LU-decomposition은 numpy.linalg에는 없지만 scipy.linalg에는 있다고 한다. numpy 1.10.0 부터는, 2차원 행렬의 곱셈에 한해 numpy.matmul 대신에 @ 를 대신할 수 있다고 한다. 포스팅에서는 자주 사용하는 몇 개의 함수만 살펴보고 모든 함수에 대한 설명은 도큐먼트를 참고하자 Matrix and v.. 2023. 2. 14.
[NumPy] 넘파이 기초 - array, 수학, 통계 What is NumPy? Python의 list는 원소의 데이터 타입(정확히는 객체)이 달라도 되고, mutable하다. 그러나 NumPy의 array는 C의 array와 특징이 비슷하다. 모든 원소의 데이터 타입은 같아야하고(당연히 메모리도 같다), fixed-size이다. 그래서 NumPy의 핵심이라 할 수 있는 것은 ndarray object이다. 엥? 넘파이도 배열 크기를 바꿀 수 있는데요? 그건 사실 새로운 배열을 만드는 것이다. 넘파이를 쓰는 이유는 수학/과학 관련 패키지가 잘 구성되어있다는 것이다. 그리고 built-in sequence가 있어서 실제로 효율적으로 계산한다. shape 변환과 정렬, 수학 공식은 물론이고 기본적인 선형대수, 통계, 랜덤 시뮬레이션, 이산 푸리에 변환까지 지원.. 2023. 2. 13.
시계열 데이터의 상관성 구하기 (time-series correlation) 서로 다른 시계열 데이터의 상관성을 어떻게 알 수 있을까?그리고 두 데이터의 길이가 다르다면?? 공통적인 주의사항으로, 상관관계를 인과관계로 해석해서는 안된다는 것임을 통계학 수업에서 많이 들어봤을 것이다.1. Pearson Correlation Coefficient (PCC, Pearson's r)통계 시간에 배우는 그 피어슨-상관계수 맞다.  \[ \rho_{X, \ Y} = \cfrac{\text{cov}(X, \ Y)}{\sigma_X \sigma_Y} = \cfrac{\mathbb{E}[XY] - \mathbb{E}[X] \mathbb{E}[Y]}{\sqrt{\mathbb{E}[X^2] - (\mathbb{E}[X])^2} \sqrt{\mathbb{E}[Y^2] - (\mathbb{E}[Y])^.. 2023. 2. 12.
728x90
반응형