[RAG] 벡터 데이터베이스 선택 가이드: Pinecone vs Milvus vs pgvector 성능 비교
처음에는 다들 비슷해 보입니다. 벡터 데이터베이스도 결국 임베딩 넣고 검색하면 되는 것 아니냐고 생각하기 쉽습니다. 그런데 서비스에 실제 사용자 트래픽이 붙고 메타데이터 필터가 늘어나고 색인 재빌드가 길어지기 시작하면 이야기가 완전히 달라집니다. 벡터 데이터베이스 성능 문제가 터지기 시작한 순간벡터 데이터베이스를 처음 검토할 때는 보통 검색 정확도만 봅니다. 그런데 운영에 들어가면 먼저 보이는 것은 latency와 비용입니다. 예를 들어 문서 검색형 RAG 서비스에서 RPS가 80에서 300 사이로 올라가고 top k가 20 이상으로 커지면, 임베딩 검색 자체보다 필터링과 네트워크 왕복, 결과 페이로드 크기, 색인 유지 비용이 더 크게 체감되더군요.실무에서는 이런 식으로 터집니다. 초반에는 문서 수가 3..