728x90 반응형 null-invariance1 [Data Science] Association Rule Mining (6) Interesting Measures Basketball과 Cereal을 각각 B, C라고 표기하자. 이때 rule의 sup과 conf를 튜플로 표기하면B→C = [40%, 66.7%] 이다. 그러나 실제 시리얼을 먹는 학생의 비율은 3750/5000=75%로 confidence보다 크다. 심지어 B 없이도 C의 비율은 P(C)=0.75로 rule B→C는 informative하지 않는다. 심지어 rule B→¬C = [20%, 33.3%]는 sup과 conf 모두 낮지만, P(¬C|B)=1750/2000으로 확률의 측면에서 도 정확하다고 할 수 있다. (more informative) 즉, support와 confidence는 association에는 유용하지만, .. 2023. 4. 3. 이전 1 다음 728x90 반응형