1. 섀도우 AI (Shadow AI)의 개념 및 위험성 개념 기업이나 조직에서 허가되지 않거나 임시로 생성한 AI 모델을 사용하는 미인증 AI 사용 환경 위험성 제어 불가 통제 불가능한 외부에서 동작하므로 개인 정보 보호, 규정 준수 포함 보안 전반에 대한 잠재적 위험 초래 숨겨진 위험 데이터 분석, 콘텐츠 생성 등 작업을 위해 개인 구독이나 무료 온라인 도구
1. 연합학습 (Federated Learning)의 개념 및 필요성 (1) 연합학습의 개념 개념도 개념 분산 저장된 데이터 이동 없이 각 장치의 학습 결과를 수집/종합하여 모델을 생성하는 분산형 머신러닝 기술 (2) 연합학습의 필요성 대규모 데이터 관리 대용량 데이터 저장 및 전송이 불필요하므로 대규모 데이터 관리 용이 분산 시스템 활용 분산된 장치의 학습 결과만 종합하므로 중앙 서버는 고성능 컴퓨팅
1. 생성형 AI (Generative AI)의 개요 (1) 생성형 AI의 개념 및 특징 개념 특징 대규모 데이터에서 패턴과 규칙을 학습하여 사용자 요구에 따라 언어, 이미지, 영상 등의 결과물을 능동적으로 생성하는 AI 기술 – 대규모 데이터 학습 및 자율 판단 수행 – 사용자 요구에 따라 새로운 콘텐츠 생성 – 언어 대화 등 사람과 자연스러운 상호작용 (2) 인공지능과
1. 파인튜닝 (Fine-Tuning)의 개념 및 필요성 개념 필요성 인공지능 모델이 특정 작업이나 도메인에 적합하도록 이미 훈련된 인공지능 모델에 특정 데이터셋을 적용하는 미세 조정 기법 – 특정 작업/도메인에 적합한 모델 생성 – 적은 데이터셋으로 높은 학습 효과 – 신규 데이터에 대한 추론 성능 향상 파인 튜닝을 통해 학습 데이터가 적은 상황에서 특정 분야 인공지능 모델의 일반화
1. 어텐션 메커니즘의 개념 및 필요성 개념 seq2seq의 경사감소 소멸(Gradient Descent Vanishing) 등 RNN 모델의 문제 해결을 위해 출력 단어 예측 시점 마다 입력 시퀀스의 단어 가중치를 계산하여 정확도 감소를 보정하는 메커니즘 필요성 어텐션 메커니즘에서 어텐션 함수는 Softmax, Sigmoid, ReLu 함수 등 활성화 함수와 함께 사용하여 입력 시퀀스의 각 단어 가중치 계산 및 예측 벡터
1. GNN (Graph Neural Network)의 개요 등장 배경 딥러닝 모델은 CNN, RNN, Transformer 등 다양한 신경망 모델 종류로 발전했지만, 복잡한 구조나 관계 임베딩의 한계로 인해 그래프(Graph) 기반 신경망 모델 등장 개념 데이터의 특징 추출을 위해 이웃 노드 간 정보를 이용하여 특징 벡터를 찾아내는 그래프(Graph) 기반 신경망 모델 특징 추상적 개념 접근에 용이 연결된 데이터 표현
1. 생성형 AI의 개념 및 윤리적 활용의 필요성 (1) 생성형 AI의 개념 및 파급효과 개념 파급 효과 대규모 데이터, 패턴 학습 기반 이용자 요구에 따라 텍스트, 이미지, 비디오, 음악, S/W 코드 등 새로운 결과물을 생성하는 인공지능 기술 – 외국어 문서 번역, 방대한 문서 요약 – 음성 회의 텍스트 기록, 회화 공부 – 소프트웨어 코딩, 작곡,
1. 대규모 언어 모델 (LLM, Large Language Model) 개요 (1) 대규모 언어 모델의 등장 배경 (2) 대규모 언어 모델의 개념 및 특징 개념 특징 인간의 언어 이해와 생성을 위해 대량의 언어 데이터 학습, 파인튜닝하여 생성된 인공신경망 기반 생성형AI 언어 모델 – LLM은 대량의 언어 데이터로 훈련하여 맥락 파악 후 적절한 응답을 생성 – 한 단어가
1. 유사도(Similarity)의 개념 및 유사도 측정의 필요성 유사도 (Similarity) 유사도 측정의 필요성 벡터 공간 내 노드(데이터 포인트) 사이의 관계를 거리, 각도 등을 통해 수치화하여 정량적으로 표현한 유사성 척도 – 데이터 간 유사도 측정 기준 제공 – AI 데이터 라벨링, 모델 학습 및 진단 – AI 데이터세트의 오류, 편향 탐지 벡터 공간 내 노드의 크기(강도, 길이)
1. 벡터 데이터베이스 (Vector Database)의 개념, 필요성 개념 필요성 대량의 고차원 데이터 저장 및 조회 위해 컨텐츠 벡터 임베딩 및 쿼리 벡터 유사도 비교 기반 신속하게 인덱싱하는 데이터베이스 – 고차원 데이터 저장 및 조회 수요 증가 – 데이터 내용 유사성에 따른 맥락 이해 – AI 서비스의 신속한 연산 처리 요구 – 대규모 언어 모델에 장기