X

Apriori (연관 규칙) 알고리즘

I. 연관성 규칙 탐사, Apriori 알고리즘

가. Apriori 알고리즘의 개념

연관 규칙(Association Rule)의 대표적인 형태로, 발생 빈도 기반 데이터 간의 연관 규칙 발견 알고리즘

나. 연관 규칙 발견 과정

  • 대용량 데이터: 트랜잭션 대상 최소지지도 이상 만족 집합 발견
  • 연관규칙 발견: 최소신뢰도 이상 만족 항목 연관 규칙 생성

II. Apriori 알고리즘의 연관 정도 정량화 기준

구분 정량화 계산식 설명
지지도
Support
S = P(X ∩ Y) – 전체 거래 중 항목 X, Y 동시 포함 거래 정도
– 전체 구매도 경향 파악
신뢰도
Confidence
C = P(Y | X) = P(X ∩ Y) / P(X) – 항목 X 포함 거래 중 Y 포함 확률
– 연관성의 정도 파악
향상도
Lift
L = P(Y | X) / P(Y)
= P(X ∩ Y) / P(X)P(Y)
– 항목 X 구매 시 Y 포함하는 경우와 Y가 임의 구매되는 경우의 비

– Apriori 알고리즘은 후보 집합 생성 시 아이템 개수가 많아지면 계산 복잡도가 증가하므로 FP-Tree 사용 필요

III. Apriori 알고리즘의 장/단점 및 활용 사례

가. Apriori 알고리즘의 장/단점

장점 단점
– 수많은 상품 연관 구매패턴
– 다른 연구가설 탐지 가능
– 원리 간단, 이해 분석 용이
– 비즈니스측면 중요한 현실적 중요 연관 규칙 부족
– 연관 규칙 결과 다량 발생

나. Apriori 알고리즘 활용 사례

구분 활용 사례
통신 – 이탈 고객 예상, 기지국 위치 선정
금융 – 대출심사, 카드 연체 고객 예상
의료 – 환자 질병 예측, 약품 부작용 예상
유통 – 매장 진열 방법, 장바구니 분석

 

Categories: 알고리즘/AI
도리:

View Comments (1)