[태그:] 인공신경망

대규모 언어 모델 (LLM, Large Language Model)

1. 대규모 언어 모델 (LLM, Large Language Model) 개요 (1) 대규모 언어 모델의 등장 배경 (2) 대규모 언어 모델의 개념 및 특징 개념 특징 인간의 언어 이해와 생성을 위해 대량의 언어 데이터 학습, 파인튜닝하여 생성된 인공신경망 기반 생성형AI 언어 모델 – LLM은 대량의 언어 데이터로 훈련하여 맥락 파악 후 적절한 응답을 생성 – 한 단어가

비지도 학습 (Unsupervised Learning)

I. 비지도 학습의 개요 가. 비지도 학습 (Unsupervised Learning, 자율 학습)의 개념 입력데이터에 대한 목표값 없이 데이터가 어떻게 구성되었는지를 알아내는 기계 학습(Machine Learning) 기법 나. 비지도 학습의 특징 비정제 데이터를 입력하여 훈련데이터 없이 데이터의 특징 요약과 군집 (Clustering) 수행 목표값을 정해주지 않아도 되고 사전 학습이 필요없으므로 속도가 빠름   II. 비지도 학습의 기법 및 알고리즘

지도 학습 (Supervised Learning)

I. 지도 학습의 개요 가. 지도 학습 (Supervised Learning)의 개념 훈련 데이터(Training Data)로부터 하나의 함수를 유추해내기 위한 기계 학습(Machine Learning) 기법 나. 지도 학습의 특징 명시적인 정답이 주어진 상황에서 기계를 학습 시키기 위해 데이터와 레이블을 사용 사람이 목표값에 개입하므로 정확도가 높으나 시간이 오래걸리고 필요 데이터량이 많음   II. 지도 학습의 기법 및 알고리즘 가. 지도

TPU (Tensor Processing Unit)

I. 인공신경망 맞춤형 ASIC, TPU 가. TPU(Tensor Processing Unit)의 개념 인공신경망 데이터 고속처리를 위한 맞춤형 ASIC 기반 인공신경망 데이터 처리 전용 하드웨어 나. TPU 부각 배경 2006년 맞춤형 H/W(ASIC, FPGA, GPU) 실행 프로그램 제한 2013년 인공신경망 패러다임은 계산요구량 / 필요성능 증가 이러한 요구 충족을 위한 GPU 증설은 과다 비용 발생   II. TPU 구성도 및

인공신경망 (Artificial Neural Network)

I. 분류와 예측 모형, 인공신경망, ANN 가. 인공신경망의 개념 인간의 뉴런을 모방하여 가중치 조정을 통한 분류와 예측을 위해 다수 노드를 연결한 계층적 조직 나. 인공신경망의 특징 특징 구성요소 예를 통한 학습 – 예를 계속 제시하여 원하는 형태 학습 일반화 – 학습 후 미학습된 입력에도 올바른 출력 연상기억 – 일부 유실된 정보 → 유사한 출력 결함

CNN (Convolutional Neural Network)

I. 2차원 이미지 분석, CNN 가. CNN의 개념 Convolution, Pooling, Fully Connected layer를 통해 특징 추출, 차원 축소하여 이미지를 분류, 인식하는 신경망 알고리즘 나. CNN의 특징 ReLU – Rectified Linear Unit 활성화 함수 – Gradient Vanishing 문제 해결 Dropout – 인공 신경망의 Overfitting 방지 위해 특정 뉴런 미동작 학습 수행 Bigdata – 과적합(Overfitting) 문제 해결