[태그:] Data Lake

머신러닝 파이프라인 (Machine Learning Pipeline)

I. 머신러닝 파이프라인(ML Pipeline)의 개요 가. 머신러닝 파이프라인의 개념 데이터 수집부터 전처리, 학습 모델 배포, 예측까지 전과정을 순차적으로 처리하도록 설계된 머신러닝 아키텍처 나. 머신러닝 파이프라인의 필요성 머신러닝 자동화 머신러닝 모델 전 과정 지속 수행 위한 파이프라인 기반 자동화 예측 정확성 향상 내부 구조 이해를 통한 머신러닝 성능(예측의 정확성) 향상   II. 머신러닝 파이프라인의 데이터 처리

데이터 레이크 (Data Lake)

I. 단일 통합 데이터 저장소, 데이터 레이크(Data Lake)의 개요 가. 데이터 레이크(Data Lake)의 개념 정형, 반정형, 비정형의 다양한 원형(Raw) 데이터들을 실시간으로 수집, 전처리, 변환, 저장, 제공하는 통합 데이터 저장소, 데이터 호수 나. 데이터 레이크(Data Lake)의 부각 배경 부각 배경 주요 이슈 Hadoop의 등장 데이터 레이크로의 전환 용이 비즈니스 민첩성 요구 비즈니스 유연성 및 신속성 제공