[카테고리:] 데이터베이스

배깅(Bagging), 부스팅(Boosting)

I. 분류 모델 생성 알고리즘, 배깅과 부스팅 배깅 부스팅 데이터에서 여러 bootstrap 자료 생성, 모델링 후 결합하여 최종 예측 모형을 만드는 알고리즘 오분류 개체들에 가중치를 적용하여 새로운 분류 규칙 생성 반복 기반 최종 예측 모형 생성   II. 배깅과 부스팅 알고리즘 수행 절차 가. 배깅 알고리즘 수행 절차 절차도 절차 ① Row data에서 bootstrap 데이터

정적인덱싱과 동적 인덱싱

I. 정적 인덱싱과 동적 인덱싱 개념 가. 정적 인덱싱의 개념도 데이터 삽입, 삭제에 따라 인덱스의 내용만 변경되고 구조는 불변하는 하드웨어 기반 인덱싱 기법 나. 동적 인덱싱의 개념 데이터 파일과 인덱스를 블록으로 구성하여 레코드 삽입을 감안하여 빈 공간을 미리 준비해 두는 블록 기반 인덱싱 기법   II. 정적 인덱싱과 동적 인덱싱의 비교 항목 정적 인덱싱 동적

데이터베이스 인덱스

I. 데이터베이스 검색속도 향상, 인덱스의 개념 데이터베이스에 저장된 자료를 빠르게 조회하기 위해 테이블에 연관되어 독립적인 저장공간 보유 객체   II. 구성된 인덱스 평가 기준 가. 테이블 형태별 인덱스 평가 기준 평가 기준 설명 소형 테이블 – 테이블이 작더라도 PK는 반드시 생성 – 자주 참조되는 테이블 경우 인덱스 필요 중대형 테이블 – 기존 인덱스 블록 사용비율 낮은

옵티마이저 (Optimizer)

I. Driving Range 최소화, 옵티마이저 가. 옵티마이저의 개념 사용자가 요청한 SQL질의를 최소의 비용을 추정하여 실행계획을 수립하는 DBMS 핵심 엔진 나. 옵티마이저의 종류 종류 개념 규칙기반 옵티마이저 (RBO) – 정해놓은 규칙에 따라 액세스 경로를 평가하고 실행 계획을 선택 비용기반 옵티마이저 (CBO) – 비용을 기반으로 실행 계획 최적화 수행 – 비용: 쿼리 수행 시 소요 일 량,

데이터베이스 해시 조인 (Hash Join)

I. 해시 함수 기반, 해시 조인 가. 해시 조인 (Hash Join)의 개념 선행 테이블에 해시 적용, 해시 영역 구성하여 후행 테이블 차례로 해시 기능 이용 조인 나. 해시 조인의 특징 대용량 처리 시 랜덤액세스와 정렬 부담 해소 대안 각 테이블 속성을 해시 키로 동일 해시 함수 사용 II. 해시 조인 구성도 및 동작 원리 가.

정렬 합병 조인 (Sort Merge Join)

I. 동시 스캔 조인 방식, 정렬 합병 조인 가. 정렬 합병 조인(Sort Merge Join)의 개념 두 테이블이 모두 정렬 시 조인 애트리뷰트 순서에 따라 동시 스캔하며 A, B값이 동일 레코드 검색 나. 정렬 합병 조인 특징 연결 시 랜덤 액세스 미수행 정렬 영역에 따라 사용 효율 차이 발생   II. 정렬 합병 조인 구성도 및

중첩 반복 조인 (Nested Loop Join)

I. 중첩 반복 조인(Nested Loop Join) 가. 중첩 반복 조인(Nested Loop Join)의 개념 다수 테이블에서 하나의 집합 기준 순차적 상대방 Row 결합하여 필요 결과 추출하는 조인 기법 나. 중첩 반복 조인의 특징 주로 좁은 범위에서 유리 순차적 처리, Random Access 위주 후행 테이블에 조인 위한 인덱스 생성 필요   II. 중첩 반복 조인 절차 구성도

데이터베이스 조인(Join) 유형

I. 조인의 개념 한 데이터베이스 내 여러 테이블을 조합하여 하나의 테이블로써 사용하기 위한 조합 방법   II. 조인의 유형 가. 논리적 조인의 종류 조인 종류 설명 Inner Join – 두 개의 관련 키로 컬럼 비교 – 조인 조건에 맞는 행만 검색 Outer Join – 조인 키에 대응되는 row가 없는 경우 null로 추출 (LEFT, RIGHT, FULL)

데이터베이스 언어 (DDL, DML, DCL)

I. DDL, DML, DCL, 데이터베이스 언어 가. 데이터베이스 언어의 개념 데이터 정의, 조작, 제어를 통한 데이터베이스 구축 및 사용자와 데이터베이스 간 통신수단   II. 데이터베이스 언어의 종류 가. 데이터 정의 언어 (DDL: Data Definition Language) – DB구조, 데이터 형식, 접근 방식 등 DB 구축, 수정 목적으로 사용하는 언어 구성요소 설명 CREATE – Schema, Domain, Table,

데이터베이스 반정규화

I. 성능 향상을 위한 데이터 중복 허용, 반정규화 개념 필요성 데이터베이스 정규화 후 성능향상, 개발편의성 등 위해 정규화기법 위배행위 의도적 수행 기법 – 다수 Join시 성능하락 방지 – 개발 및 운영 단순화 – DB 검색 성능 향상   II. 반정규화 필요 대상 및 유형 가. 반정규화 필요 대상 구분 필요 대상 설명 접근빈도 측면 고빈도 테이블 – 단일