Supervised vs Unsupervised
Supervised Labels on Graphs
Node label $\mathbf{y}_{v}$: citation network에서 어떤 subject가 node에 속하는지
Edge label $\mathbf{y}_{uv}$: transaction network에서 edge가 fraud인지 아닌지
Graph label $\mathbf{y}_{G}$: 분자 그래프에서 신약이 될 가능성 예측
Unsupervised Signals on Graphs
그러나 대부분 우리는 그래프 구조는 갖고 있지만 external label이 없는 경우가 많다.
self-supervised learning을 고려한다.
Node label $\mathbf{y}_{v}$: Node statisticcs를 이용한다. (clustering coefficient, PageRank, 등)
Edge label $\mathbf{y}_{uv}$: 두 노드의 edge를 숨기고, link prediction
Graph label $\mathbf{y}_{G}$: Graph statistics 이용 (두 그래프가 isomorphic한지)
Loss function
Classification Loss
$i$번째 data point에 대한 $K$-way prediction
$N$개의 training example에 대한 Total loss는 다음과 같다.
Regression Loss
regression task에서 자주 사용되는 loss는 mean squared errer (MSE) 이다. (L2-loss)
Evaluation Metrics
Regression
기존 ML task에서 사용되는 것과 동일하다. sklearn이 구현한 것을 사용한다.
Classification
multi-class 분류에서는 accuracy를 이용하고,
binary classification에서는 accuracy뿐만 아니라 precision/recall을 사용할 수 있다. 또한 ROC, AUC를 이용한다.
'스터디 > 인공지능, 딥러닝, 머신러닝' 카테고리의 다른 글
[CS224w] Dataset Split (0) | 2023.05.29 |
---|---|
[Clustering] Density-Based Methods, DBSCAN (0) | 2023.05.25 |
[Clustering] BIRCH Algorithm (0) | 2023.05.23 |
[Clustering] Hierarchical Clustering (계층적 군집화) (0) | 2023.05.22 |
[Clustering] Drawbacks of K-means and Solutions with Python (K-means 단점과 해결방법) (0) | 2023.05.21 |