728x90 반응형 스터디/데이터사이언스88 [Data Science] Attribute Types Attribute, 속성attribute는 어떤 객체(object)의 성질이나 특징이다. e.g. 사람의 눈 색깔, 온도, 계좌 잔금 등 Attribute TypesCategorical: qualitativeNominal: category(범주), state(상태), namesBinray: Nominal의 특별한 경우로, 2개의 state만 있는 형태. (0과 1, True or False, etc.)Ordinal: 순서가 있는 값. 그러나 간격의 크기는 의미를 갖지 않는다. Numeric: quantitative. discrete와 continuous한 값을 가질 수 있다.Interval: 같은 단위의 크기를 갖는 양. 0은 arbitrary-zero로 존재한다.(true-zero는 존재하지 않는다... 2023. 3. 9. [pandas] [판다스] DataFrame 조작하기, MultiIndex 전에 만든 미국 5개주의 인구와 면적 데이터를 이용해보자. Transpose DataFrame은 2차원 배열로 취급하므로 전치행렬과 같은 transpose 연산이 가능하다. population_dict = { 'California': 38332521, 'Texas': 26448193, 'New York': 19651127, 'Florida': 19552860, 'Illinois': 12882135, } area_dict = { 'California': 423967, 'Texas': 695662, 'New York': 141297, 'Florida': 170312, 'Illinois': 149995, } states_T = pd.DataFrame([population_dict, area_dict], ind.. 2023. 2. 15. [pandas] [판다스] 판다스 기초 pandas는 크게 3가지 Object로 구성되어있다. Index, Series, DataFrame Index object Series와 DataFrame은 index 객체를 포함하고있고, index를 바탕으로 데이터를 조작/변형할 수 있다. Series는 1개의 index를, DataFrame은 2개의 index(row index, column index)를 갖고 있다. Index는 immutable array이고 ordered set이다. multi-set이므로 repeated value를 가질 수 있다. ind = pd.Index([2, 3, 5, 5, 11]) print(ind) print(ind.size, ind.shape, ind.ndim, ind.dtype) ----- result -----.. 2023. 2. 15. [NumPy] 넘파이 - 선형대수 numpy.linalg 모듈에 선형대수 관련 함수들이 있다. 내부적으로는 원래 선형대수 라이브러리인 BLAS와 LAPACK을 바탕으로 구현되어있다고 한다. (이 두 라이브러리를 사용하진 않았지만 아마 함수 이름이나 API가 같을 것으로 예상된다.) 또한 Scipy와도 많은 부분이 공통된 함수가 있는데, 일부 기능은 Scipy가 더 많이 가지고 있다. 예를 들어, LU-decomposition은 numpy.linalg에는 없지만 scipy.linalg에는 있다고 한다. numpy 1.10.0 부터는, 2차원 행렬의 곱셈에 한해 numpy.matmul 대신에 @ 를 대신할 수 있다고 한다. 포스팅에서는 자주 사용하는 몇 개의 함수만 살펴보고 모든 함수에 대한 설명은 도큐먼트를 참고하자 Matrix and v.. 2023. 2. 14. 이전 1 ··· 12 13 14 15 다음 728x90 반응형