Apriori (연관 규칙) 알고리즘

I. 연관성 규칙 탐사, Apriori 알고리즘

연관 규칙(Association Rule)의 대표적인 형태로, 발생 빈도 기반 데이터 간의 연관 규칙 발견 알고리즘

구분	정량화 계산식	설명
지지도 Support	S = P(X ∩ Y)	– 전체 거래 중 항목 X, Y 동시 포함 거래 정도 – 전체 구매도 경향 파악
신뢰도 Confidence	C = P(Y \| X) = P(X ∩ Y) / P(X)	– 항목 X 포함 거래 중 Y 포함 확률 – 연관성의 정도 파악
향상도 Lift	L = P(Y \| X) / P(Y) = P(X ∩ Y) / P(X)P(Y)	– 항목 X 구매 시 Y 포함하는 경우와 Y가 임의 구매되는 경우의 비

– Apriori 알고리즘은 후보 집합 생성 시 아이템 개수가 많아지면 계산 복잡도가 증가하므로 FP-Tree 사용 필요

장점	단점
– 수많은 상품 연관 구매패턴 – 다른 연구가설 탐지 가능 – 원리 간단, 이해 분석 용이	– 비즈니스측면 중요한 현실적 중요 연관 규칙 부족 – 연관 규칙 결과 다량 발생