본문 바로가기
728x90
반응형

분류 전체보기249

[CS246] PageRank PageRank: Ranking Nodes on the GraphWeb as a Directed GraphWeb 데이터는 방향그래프로 나타낼 수 있다. 노드는 webpage, edge는 hyperlink로 대응하여 생각할 수 있다.그래프 용어가 나오므로 익숙하지 않다면 여기를 참고해도 좋다.https://trivia-starage.tistory.com/213 [CS224w, 2018] Network RepresentationDirected & Undirected 위 그림의 왼쪽 빨간색 그래프는 무방향 그래프(undirected graph)이다. link는 symmetric, reciprocal 하다는 특징이 있다. 예를 들어 친구관계(서로 친구관계), 또는 협업(collaboration, 방향성trivi.. 2023. 10. 26.
[CS246] RecSys (4) - Latent Factor Models (Matrix Factorization, MF, UV decomposition) 이번 포스팅은 2006년에 넷플릭스 대회를 통해 실제 추천시스템 대회에서 utility matrix의 형태와 평가기준(evaluation criterion)에 대해 살펴본다. 그리고 넷플릭스 utitlity matrix를 채우는 방법으로 UV decomposition을 소개하고, 이를 이용한 모델을 설명한다. ※ Matrix Factorization (MF)은 종종 UV decomposition 등으로 불린다. ※ MF로 얻는 두 행렬은 Google에서는 U와 V, wiki에서는 H와 W로 표기한다. 여기서는 CS246의 표기(P와 Q)를 따른다. The Netflix Prize Training data 100M개의 ratings (1-5의 평점을 가짐) user 수: 480K movie 수: 18K T.. 2023. 10. 24.
[CS224w, 2018] Network Properties and Real World Key properties 주로 4가지 성질에 대해서 알아보자. degree distribution($P(k)$), path length($h$), clustering coefficient($C$), connected components($s$)에 대해 살펴보자. 1. Degree distribution 노드 차수(degree)의 분포를 $P(k)$로 부른다. 이때 $k$는 degree를 의미한다. 전체 노드 개수를 $N$, 노드 차수가 $k$인 노드의 개수를 $N_k$라 하면 $P(k) = \cfrac{N_k}{N}$ 이다. 2. Paths in a graph path는 노드의 수열(sequence of nodes)을 나타낸다. 이때 차례로 나타나는 노드는 이전 노드와 연결되어있어야 한다. path는 .. 2023. 10. 22.
[CS224w, 2018] Network Representation Directed & Undirected 위 그림의 왼쪽 빨간색 그래프는 무방향 그래프(undirected graph)이다. link는 symmetric, reciprocal 하다는 특징이 있다. 예를 들어 친구관계(서로 친구관계), 또는 협업(collaboration, 방향성이 없음)을 표현할 때 사용될 수 있다. 오른쪽 그림의 녹색 그래프는 방향 그래프(directed graph)이다. link는 종종 arc라고도 불린다. phone call이다 SNS에서의 follow 등을 표현할 수 있다. Node degrees (노드 차수) 일반적으로 노드의 이웃하는 edge의 개수를 의미하고, $k$를 이용하여 표기한다. Undirected Graph 노드 $i$의 이웃하는 edge의 개수를 $k_i$라 한다... 2023. 10. 17.
[CS224w, 2018] Network Centrality Motivation social network가 주어졌을 때, 어떤 node가 더 중요 (more important, influential) 할까? 이때 centrality measure는 node 중요도를 설명해줄 수 있다. Centrality measure로 Geometric measure, Spectral measure, Path-based measure, Subgraph-based measure가 있다. Geometric Measures In-degree Centrality \[ c_{\text{deg}}(x) = d_{in}(x) \] distance가 $1$인 node의 개수이다. 또한 majority voting과 동일하다. Closeness Centrality 더 central한 node일.. 2023. 10. 16.
[Sampling] Markov Chain Monte Carlo (MCMC) (4) - Slice sampling Slice Sampling proposal distribution 없이 $p(x)$ 또는 $\tilde{p}(x)$로부터 직접 샘플링하는 방법이다. 일반적으로 univariate multi-modal distribution에 유용하다. (논문저자 Radford M. Neal에 따르면 multivariate의 경우에도 slice sampling을 변형하여 샘플링 할 수 있다. 여기서는 생략) Algorithm slice variable $u$를 도입한다. (책에 따라 auxiliary variable, additional variable이라고도 한다.) \[ p(x,u) = \cfrac{\mathbf {1}_{ \{ 0 \le u \le \tilde{p}(x) \} } }{Z}, \ \int_0^{\til.. 2023. 10. 15.
728x90
반응형