1. 데이터 마이닝 방법론, SEMMA의 개념 SEMMA (Sample, Explore, Modify, Model, and Assess): 샘플링, 탐색, 수정, 모델링, 평가 절차 개념 이전에 알려지지 않았던 패턴 발견 위해 대량의 데이터를 샘플링, 탐색, 수정, 모델링 및 평가하는 데이터 마이닝 방법론 특징 데이터 샘플링 샘플은 중요한 정보 포함하고 처리 가능한 크기여야 함 데이터 패턴 도출 예상 못한 추세, 이상
1. 데이터 마이닝 방법론, CRISP-DM의 개념 CRISP-DM (Cross-Industry Standard Process for Data Mining): 데이터 마이닝을 위한 산업 간 표준 절차 개념 비즈니스 이해를 바탕으로 데이터를 분석하기 위해 6단계 프로세스 기반 비즈니스 상황에 따른 통계적 규칙, 패턴을 찾아내는 데이터 마이닝 방법론 특징 6단계 프로세스 ① 비즈니스 이해 ② 데이터 이해 ③ 데이터 준비 ④ 모델링 ⑤
1. 데이터 마이닝 방법론, KDD의 개요 KDD (Knowledge Discovery in Database) (1) KDD의 개념 및 특징 개념 특징 DW, OLAP, SQL, 데이터 분석 Tool 등을 이용하여 데이터에 잠재된 유용한 지식 및 패턴을 발견하여 조직의 구조와 프로세스를 변경하는 데이터 마이닝 방법론 – 데이터 범람 문제 해결 지원 – 유용한 정보 검색 위한 선별 작업 – DB