LLM 기반 질의 응답 기술

질의 응답 시스템의 기본 원리

기계 독해 기반 질의 응답

  • 주어진 텍스트의 문맥(Context)을 이해하고, 그 문맥 내에서 질문에 대한 답을 찾아내는 방식

1. 작동 원리

1단계: 입력 처리 (Input Processing)
  • 사용자의 질문과 함께 답변의 근거가 되는 텍스트 문맥 입력
  • 질문과 문맥 토큰화(Tokenization)
  • 각 토큰을 벡터(Vector) 형태로 임베딩(Embedding)
    • 단어의 의미와 문맥 정보를 담는 단어 임베딩이나 문맥적 임베딩 모델이 사용됨
2단계: 문맥 이해 (Context Understanding)
  • 임베딩된 질문과 문맥을 바탕으로 질문과 문맥 간의 관계 파악
  • 문맥 내에서 질문과 관련된 정보 식별
  • 주의(Attention) 메커니즘, 트랜스포머(Transformer) 구조와 같은 딥러닝 모델을 사용하여 문맥 전체 이해
  • 질문의 각 단어가 문맥의 어떤 부분과 관련이 있는지 집중적으로 학습
3단계: 답변 예측 (Answer Prediction)
  • 문맥 내에서 질문에 대한 답이 시작되는 위치와 끝나는 위치를 예측
    • 주로 각 토큰이 답변의 시작 또는 끝일 확률을 계산하는 방식 사용
  • 예측된 시작 위치부터 끝 위치까지의 텍스트 영역을 최종 답변으로 추출 → 사용자에게 제공

2. 핵심 특징

  • 장점
    • 별도의 지식 베이스 구축 없이 주어진 문맥 내에서 정확한 답변을 찾아낼 수 있음
    • 복잡한 추론 없이 문맥에 기반한 답변이 가능함
  • 단점
    • 주어진 문맥을 벗어나는 질문에는 답변할 수 없음
    • 긴 문맥이나 복잡한 문맥 이해에 어려움을 겪을 수 있음

3. 활용 예시

  • SQuAD(Stanford Question Answering Dataset) 등의 데이터셋을 기반으로 학습된 질의 응답 모델
  • 문서 기반 챗봇