728x90 반응형 Frequent-Pattern Mining1 [Data Science] Association Rule Mining (4) FP-Growth 이번 글에서는 FP-Tree를 이용한 FP-Growth 알고리즘을 이용하여 frequent itemset mining을 해보자. MotivationApriori principle의 마지막에서 서술했듯이, DB scan을 계속 반복해야하는 단점이 있다. 이는 여전히 비용이 큰 요소이다.게다가 패턴이 긴 경우(long pattern) 은 DB scan을 반복하는것은 물론이고 candidate가 굉장히 많아진다는 문제가 있다. 결국 문제는 candidate generation이다!! Heuristic$P$가 frequent itemset이고, $S$가 $P$를 포함하는 transaction 집합이고 $x$가 item이라 하자. 이때 $x \in S$라면 $\{ x \} \cup P$ 역시 frequent it.. 2023. 4. 2. 이전 1 다음 728x90 반응형