728x90 반응형 Data Analysis3 [Pandas] Basic Statistics 살펴보기 Import libraries 기본적으로 사용되는 파이썬 라이브러리를 import하자. import numpy as np import scipy as sp import pandas as pd import matplotlib.pyplot as plt import seaborn as sns DataFrame pandas는 다양한 형식의 파일을 읽고 쓸 수 있다. df = pd.read_csv('my_csv_file.csv') df = pd.read_excel('my_excel_file.xlsx', sheet_name='Sheet1', index_col=None, na_values=['NA']) df = pd.read_stata('my_file.dta') df = pd.read_sas('my_file.sas7.. 2023. 4. 10. [Data Science] Measuring Data Similarity and Dissimilarity Data Matrix$n$개의 object와 $p$개의 attribute를 갖는 데이터가 있다고 하자. 우리는 이런 데이터를 $n \times p$ matrix로 표현할 수 있다. \[ \begin{bmatrix} x_{11} & \cdots & x_{1f} & \cdots & x_{1p} \\ \cdots & \cdots & \cdots & \cdots & \cdots \\ x_{i1} & \cdots & x_{if} & \cdots & x_{ip} \\ \cdots & \cdots & \cdots & \cdots & \cdots \\ x_{n1} & \cdots & x_{nf} & \cdots & x_{np} \\ \end{bmatrix} \]이 때 $1$번째 object의 데이터는 $x_1 = (x.. 2023. 3. 22. [Data Science] Attribute Types Attribute, 속성attribute는 어떤 객체(object)의 성질이나 특징이다. e.g. 사람의 눈 색깔, 온도, 계좌 잔금 등 Attribute TypesCategorical: qualitativeNominal: category(범주), state(상태), namesBinray: Nominal의 특별한 경우로, 2개의 state만 있는 형태. (0과 1, True or False, etc.)Ordinal: 순서가 있는 값. 그러나 간격의 크기는 의미를 갖지 않는다. Numeric: quantitative. discrete와 continuous한 값을 가질 수 있다.Interval: 같은 단위의 크기를 갖는 양. 0은 arbitrary-zero로 존재한다.(true-zero는 존재하지 않는다... 2023. 3. 9. 이전 1 다음 728x90 반응형