TECH · ~3 мин чтения
Vector database
База данных, которая хранит векторы (embeddings) и быстро находит похожие. Сердце RAG-систем. Pinecone, Weaviate, Supabase Vector.
Развёрнутое объяснение
Vector database — специальная БД для хранения и поиска по embeddings. Embedding — это вектор из 768-3072 чисел, представляющий смысл текста/картинки. Похожие тексты имеют похожие векторы.
Зачем: классические БД ищут по точному совпадению («WHERE id = 123»). Vector DB ищут по семантическому смыслу («найди тексты, похожие на этот вектор»). Это позволяет делать RAG, рекомендации, поиск дубликатов.
Популярные: Pinecone (managed, дорогой), Weaviate (open-source + managed), Supabase Vector (если у тебя Supabase), Qdrant, Milvus, pgvector (Postgres extension).
Пример
У тебя 5 000 описаний товаров. Каждое — embedding 1536-мерный вектор. Пользователь пишет «нужна железяка для двери что не скрипит». Vector DB за 50 мс находит топ-10 товаров с похожим смыслом — петли, амортизаторы, демпферы. Без точного совпадения слов.
Где это в услугах WRAW
- Supabase Vector в RAG-ботах
- Pinecone для крупных каталогов
Частые вопросы
Связанные термины
Embedding
Преобразование текста (или картинки) в вектор чисел, который представляет смысл. Похожие смыслы = похожие векторы. Основ…
RAG
Retrieval-Augmented Generation — архитектура AI-бота, которая ищет ответ в твоей базе документов перед тем, как сгенерир…
LLM
Large Language Model — большая языковая модель. ChatGPT, Claude, Gemini — это всё LLM. Обучены на миллиардах текстов и у…