반응형
embedding model
-
✅ Sentence Transformers의 Bi-Encoder vs Cross-Encoder 비교 분석AI와 함께 2025. 3. 27. 11:01
1. 서론Sentence Transformers는 텍스트 의미를 벡터로 표현하여 다양한 자연어 처리(NLP) 응용에 활용되는 대표적인 문장 임베딩 프레임워크입니다. 이 프레임워크는 두 가지 주요 아키텍처인 Bi-Encoder와 Cross-Encoder를 제공하며, 두 모델은 정확도, 처리 속도, 확장성 측면에서 상호보완적인 특성을 갖습니다. 본 보고서는 각 모델의 작동 원리, 장단점, 데이터셋 구조, 실제 활용 사례를 종합적으로 비교합니다.2. 작동 방식 및 구조 비교Bi-Encoder: 두 문장을 독립적으로 임베딩한 후, 코사인 유사도 등의 거리 메트릭으로 유사도를 계산함. (Embedding Model)✔ 빠른 유사도 계산✔ 벡터 사전 계산 및 재사용 가능❌ 문맥 이해력 상대적으로 낮음Cross-En..