[카테고리:] 데이터베이스

벡터 데이터베이스 (Vector Database)

1. 벡터 데이터베이스 (Vector Database)의 개념, 필요성 개념 필요성 대량의 고차원 데이터 저장 및 조회 위해 컨텐츠 벡터 임베딩 및 쿼리 벡터 유사도 비교 기반 신속하게 인덱싱하는 데이터베이스 – 고차원 데이터 저장 및 조회 수요 증가 – 데이터 내용 유사성에 따른 맥락 이해 – AI 서비스의 신속한 연산 처리 요구 – 대규모 언어 모델에 장기

그래프QL (GraphQL)

1. 그래프QL (GraphQL)의 개념 및 특징 개념 특징 데이터 접근성 보장을 위해 서버에서 정확히 지정된 구조로 데이터를 반환하도록 필요 데이터 구조를 지정하는 데이터 질의어 – 오버페칭과 언더페칭 해결 – 하나의 엔드포인트에 여러 API 요청 – 오브젝트의 필요한 필드만 요청 – 클라이언트 로직 간결화 그래프QL은 그래프(Graph)가 현실 세계의 데이터를 표현하는 적합한 방법이라는 사실에 착안하여 메타(구 페이스북)에서

데이터베이스 스키마(Schema)

1. 데이터베이스 스키마(Schema)의 개요 (1) 데이터베이스 스키마의 개념 데이터 개체(entity), 속성(attribute), 관계(relationship)를 포함하는 데이터베이스 구조(structure)와 제약조건(constraints)에 대한 명세 (2) 데이터베이스 스키마의 특징 메타데이터 시스템 카탈로그(데이터 사전)에 저장되며, 데이터에 관한 데이터를 의미 데이터 모델링 현실 세계의 특정한 부분을 추상화하여 데이터 모델로 표현 시간 불변성 스키마는 시간의 흐름에 따라 변하지 않음 구조화 데이터의 구조적 특성을 의미하며, 인스턴스에

데이터 웨어하우스(DW)와 데이터 레이크(DL)

1. 데이터 웨어하우스와 데이터 레이크의 개념/처리과정 비교 항목 데이터 웨어하우스 (Data Warehouse) 데이터 레이크 (Data Lake) 개념 기업 및 조직의 데이터 기반 의사결정을 지원하기 위해 데이터를 추출, 변환, 적재(ETL)하여 분석, 시각화를 제공하는 통합 데이터 저장소 AI/ML 및 고급 분석을 위해 정형, 비정형의 다양한 원천 데이터를 그대로 수집/적재 하여 변환, 분석, 시각화를 제공하는 통합 데이터 저장소

데이터베이스 샤딩 (Sharding)

1. 데이터베이스 수평 분할, 샤딩(Sharding)의 개념 개념도 개념 물리적으로 다른 데이터베이스에 동일한 테이블 스키마를 가진 데이터를 수평 분할하여 분산 저장 및 조회하는 데이터베이스 수평 분할 기법 샤딩 기법은 RDBMS 뿐 아니라 MongoDB 등 NoSQL, 블록체인 등에서도 활용하는 Scale-out 방식의 신뢰성 확보 및 성능 개선 기법   2. 샤드(Shard) 분할 기법 및 분할 시 고려사항 (1)

IMDG (In-Memory Data Grid)

1. IMDG(In-Memory Data Grid)의 개요 (1) IMDG의 개념 대용량 데이터 관리 위해 다수의 컴퓨터 메모리를 그리드로 연결하여 주 데이터 저장소로 활용하는 고가용성 및 확장성 제공 분산 메모리 시스템 (2) IMDG의 특징 및 요구사항 특징 요구사항 세부 사항 고가용성 복제 데이터 복제를 통한 이중화 구성 지속적 관리 Write-through, Write-behind, DRM 확장성 파티셔닝 데이터 분할 규칙에 따른

데이터 인증, DQC (Database Quality Certification)

1. 비즈니스 신뢰성과 효율성 확보, DQC (Database Quality Certification)의 개요 개념 공공/민간에서 개발하여 활용 중인 정보시스템의 데이터 품질을 확보하기 위해 데이터 자체 품질과 데이터 관리체계, 데이터 보안 요소를 심사·인증하는 제도 필요성 인증 종목 한국데이터산업진흥원에서는 데이터 인증을 위해 데이터 품질 인증(DQC-V), 데이터 관리 인증(DQC-M), 데이터 보안 인증(DQC-V)의 각 종목 별 인증 시행   2. DQC의 인증

NewSQL

I. RDBMS와 NoSQL 장점 제공, NewSQL의 개념 및 특징 가. NewSQL의 개념 RDBMS의 ACID 특성을 유지하며 OLTP 워크로드에 NoSQL의 확장성을 제공하는 데이터베이스 관리 시스템 나. NewSQL의 특징 특징 특징 설명 신규 아키텍처 – 비공유 노드 클러스터를 사용, 각 노드는 데이터의 하위 집합 관리 – 분산 동시성 제어, 흐름 제어 및 분산 쿼리 처리 SQL 최적화 및

데이터베이스 튜닝 (DB Tuning)

I. DB성능 최적화, 데이터베이스 튜닝 (DB Tuning) 개요 가. 데이터베이스 튜닝의 필요성 일반적으로 시스템 성능 저하 문제는 잘못된 APP 및 DB 설계에 의해 발생하며, 데이터베이스 튜닝을 통해 성능 저하 최소화 가능  나. 데이터베이스 튜닝의 개념 데이터베이스 응용, 데이터베이스 자체, 운영체제의 조정 등을 통하여 최적의 자원으로 최적의 성능(응답속도)을 얻을 수 있도록 개선하는 작업   II. 데이터베이스

데이터베이스 랜덤액세스 (Random Access)

I. DB성능 확보를 위한 랜덤액세스의 개념 데이터베이스 성능을 확보하기 위해 rowid 기반 인덱스 참조 후 한 번에 하나의 블록 액세스 하는 방식   II. 랜덤액세스의 유형 유형 항목 설명 확인 랜덤 액세스 개념 – WHERE 조건의 컬럼이 인덱스에 존재하지 않아 테이블을 액세스하는 랜덤액세스 특징 – 랜덤액세스의 횟수보다 최종 결과가 동일하거나 적게 추출 고려 사항 –