[LLM] LLM 기반의 시스템을 평가하는 방법을 알아보자
·
LLM/Basic
LLM 성능 평가 1. Performance Metrics(1) 통계적인 방식의 Metrics BLEU Score: 기계 번역 품질을 평가. LLM의 출력과 레퍼런스 번역의 일치 정도를 평가 (단어 일치 중심).ROUGE Score: 텍스트 요약 품질 평가. 출력 요약이 레퍼런스 요약의 핵심 키워드를 얼마나 잘 반영하는지 평가.딥러닝 기반의 생성 모델(Generative Model)은 텍스트 생성, 챗봇, 문서 요약 등 다양한 분야에서 사용. 생성된 문장을 평가하는 방법으로는 BLEU와 ROUGE 두 가지가 있으며, 이를 통해 모델의 성능을 측정할 수 있음BLEU와 ROUGE의 차이ROUGE: Reference Sentence의 단어가 Generated Sentence에 포함되는 정도를 측정.BLEU: ..
[LLM] Transformer에서 인코더(Encoder)와 디코더 (Decoder)
·
LLM/Basic
오늘은 Transformer에서 인코더와 디코더의 개념을 정리하여 보고 특징을 알아보았다. Transformer : 인코더와 디코더트랜스포머(Transformer) 모델은 인코더(Encoder)와 디코더(Decoder)라는 두 가지 핵심 부분으로 나뉘어 있다. 이 두 부분은 각각 입력 문장을 이해하고, 이를 바탕으로 출력을 생성하는 중요한 역할을 한다. 이제 각 부분이 어떻게 동작하는지, 무엇이 다른지, 그리고 각각의 특징을 좀 더 자세히 살펴보자. 인코더(Encoder): 입력 데이터를 처리하고 핵심 정보를 포착하여 압축된 표현으로 변환합니다. 예를 들어, 번역 작업에서 인코더는 영어 문장을 받아 그 언어적 특징과 의미를 나타내는 벡터로 변환다.디코더(Decoder): 인코더가 변환한 표현을 받아 출력..