본문 바로가기
728x90
반응형

cs24635

[CS246] TrustRank vs. LinkFarms TrustRank: Bias Random Walk to trustworthy pagesLink Farms: Create link to boost PageRank of particular pagespammer들은 구글의 PageRank를 역이용하여 특정 페이지의 pagerank score를 극대화시켜 페이지 상단에 노출시키려 한다. spammer의 시각에서 웹페이지는 3개의 종류가 있다.Owned pages: spammer가 소유권을 가지고 있어서 무엇이든 할 수 있는 페이지. (completely control)Accessible pages: 소유권은 없지만, 댓글 등으로 자신의 링크를 post할 수 있는 페이지. 블로그 댓글, 뉴스 댓글 또는 위키피디아의 링크 등이 있다.Inaccessible page.. 2023. 11. 6.
[CS246] Topic-Specific PageRank Topic-Specific PageRank: Measure importance within a topicMotivation사용자가 웹 서핑을 할때는 페이지의 중요도(importance) 뿐만 아니라 사용자의 주제(topic)도 반영해야 한다.standard PageRank에서는 모든 페이지에 랜덤하게 teloport하지만, topic-specific한 주제들에서만 연관검색이 되도록 teleport set $S$를 이용한다. Matrix Formulation\[ A_{ij} = \begin{cases} \beta M_{ij} + (1-\beta) / |S| & \text{if } i \in S \\ \beta M_{ij} & \text{otherwise} \end{cases} \] Example: Topi.. 2023. 11. 5.
[CS246] PageRank PageRank: Ranking Nodes on the GraphWeb as a Directed GraphWeb 데이터는 방향그래프로 나타낼 수 있다. 노드는 webpage, edge는 hyperlink로 대응하여 생각할 수 있다.그래프 용어가 나오므로 익숙하지 않다면 여기를 참고해도 좋다.https://trivia-starage.tistory.com/213 [CS224w, 2018] Network RepresentationDirected & Undirected 위 그림의 왼쪽 빨간색 그래프는 무방향 그래프(undirected graph)이다. link는 symmetric, reciprocal 하다는 특징이 있다. 예를 들어 친구관계(서로 친구관계), 또는 협업(collaboration, 방향성trivi.. 2023. 10. 26.
[CS246] RecSys (4) - Latent Factor Models (Matrix Factorization, MF, UV decomposition) 이번 포스팅은 2006년에 넷플릭스 대회를 통해 실제 추천시스템 대회에서 utility matrix의 형태와 평가기준(evaluation criterion)에 대해 살펴본다.그리고 넷플릭스 utitlity matrix를 채우는 방법으로 UV decomposition을 소개하고, 이를 이용한 모델을 설명한다. ※ Matrix Factorization (MF)은 종종 UV decomposition 등으로 불린다.※ MF로 얻는 두 행렬은 Google에서는 U와 V, wiki에서는 H와 W로 표기한다. 여기서는 CS246의 표기(P와 Q)를 따른다.The Netflix PrizeTraining data100M개의 ratings (1-5의 평점을 가짐)user 수: 480Kmovie 수: 18KTest data.. 2023. 10. 24.
[CS246] RecSys (3) - Collaborative Filtering (CF) Collaborative FilteringContent-based 방법은 다른 user의 정보를 이용하지 않고 item profile을 이용했다. (user profile도 사실상 item profile에서 만들었음). Collaborative Filtering(CF)은 다른 user의 정보를 이용하여 item을 추천해주는 방법이다. 이 방법은 item이나 user profile을 만들지 않는다. 대신에 utility matrix의 row/column을 이용한다. user-user collaborative filtering과 item-item collaborative filtering 이렇게 2가지 방법이 존재한다.User-User Collaborative Filteringuser X의 rating과 유.. 2023. 10. 13.
[CS246] RecSys (2) - Content-based Approach Main ideaitem은 profile(혹은 feature라고도 부른다.)을 갖는다.item이 video라면 [장르, 감독, 배우, 줄거리, 개봉연도 등] 의 profile을 갖고,item이 new라면 [keyword 집합] 을 profile로 가질 수 있다. 추천시스템은 customer $x$에게 과거 높은 점수(highly rated)를 가진 item과 유사한 item을 추천해주는 방법이다.Item Profiles이제 item profile을 만들어보자. Profile은 feature의 집합(또는 feature vector)로 나타낼 수 있다.위에서 언급한 movie의 profile은  [장르, 감독, 배우, 줄거리, 개봉연도 ] 이므로 vector이고,text document와 같은 경우 {key.. 2023. 10. 13.
728x90
반응형