Можно ли полностью устранить галлюцинации?

Нет. Минимизировать через RAG + validation + temp=0 + system prompts. Но 100% гарантии нет — поэтому критичные задачи всегда с human approval.

Какие модели меньше галлюцинируют?

Claude (Anthropic) выраженно меньше галлюцинирует на factual задачах. GPT-4 и Gemini примерно одинаково. Но на любой можно поймать.

AI / ML · ~3 мин чтения

Hallucination

Когда LLM уверенно выдумывает факты, которых не существует. «Президент KZ — Иван Петров». Главный недостаток LLM. Лечится RAG, validation, system prompts.

Развёрнутое объяснение

Hallucination — феномен, когда LLM генерирует правдоподобный, но неверный ответ. Модель не «знает», что не знает — она генерирует наиболее вероятное продолжение, даже если факт ложный.

Источники галлюцинаций: 1) пробелы в обучающих данных, 2) устаревшие данные, 3) запутанный prompt, 4) низкая температура samplинга на нечётких задачах.

Защита: RAG (модель отвечает только по предоставленному контексту), system prompt («если не знаешь — скажи `не знаю`»), validation (проверка фактов автоматом), human-in-the-loop на критичных задачах.

Пример

Спрашиваешь у Claude: «Кто основал WRAW?». Если в обучении модели нет данных — она может выдумать. С RAG (модель видит твой /about) — отвечает «Алексей Функнер» правильно.

Где это в услугах WRAW

Все RAG-боты с system prompt «отвечай только по контексту»
На критичных задачах (юр, мед, фин) — human-in-the-loop

Hallucination

Развёрнутое объяснение

Где это в услугах WRAW

Частые вопросы

Связанные термины

LLM

RAG

Prompt engineering

Хочешь узнать как мы используем Hallucination в проектах?