Перейти к основному контенту

TECH · ~3 мин чтения

Vector database

База данных, которая хранит векторы (embeddings) и быстро находит похожие. Сердце RAG-систем. Pinecone, Weaviate, Supabase Vector.

Развёрнутое объяснение

Vector database — специальная БД для хранения и поиска по embeddings. Embedding — это вектор из 768-3072 чисел, представляющий смысл текста/картинки. Похожие тексты имеют похожие векторы.

Зачем: классические БД ищут по точному совпадению («WHERE id = 123»). Vector DB ищут по семантическому смыслу («найди тексты, похожие на этот вектор»). Это позволяет делать RAG, рекомендации, поиск дубликатов.

Популярные: Pinecone (managed, дорогой), Weaviate (open-source + managed), Supabase Vector (если у тебя Supabase), Qdrant, Milvus, pgvector (Postgres extension).

Пример

У тебя 5 000 описаний товаров. Каждое — embedding 1536-мерный вектор. Пользователь пишет «нужна железяка для двери что не скрипит». Vector DB за 50 мс находит топ-10 товаров с похожим смыслом — петли, амортизаторы, демпферы. Без точного совпадения слов.

Где это в услугах WRAW

  • Supabase Vector в RAG-ботах
  • Pinecone для крупных каталогов

Частые вопросы

Хочешь узнать как мы используем Vector database в проектах?