Лиды из трафика, который раньше уходил молча
Бот вступает в разговор с теми, кто никогда не заполнил бы форму и не позвонил бы. Это новый источник заявок, а не замена существующих.
IAM.Bot встраивается на сайт одной строкой. Отвечает на вопросы о продукте из вашей базы знаний, ведёт посетителя по воронке продаж, сам пишет первым, если гость молчит, и передаёт готовый лид в Telegram и CRM.
Откройте чат в правом нижнем углу и задайте вопрос — ровно так IAM.Bot увидят посетители вашего сайта. Тот же виджет, тот же бэкенд, та же воронка.
Посетитель приходит с рекламы, не находит ответ за минуту — и закрывает вкладку. Форма обратной связи собирает единицы. IAM.Bot вступает в диалог сразу: отвечает на вопросы, снимает возражения и доводит до контакта — круглосуточно и без найма операторов.
Тот же поток посетителей приносит больше заявок: бот ловит интерес в момент, когда он есть, а не ждёт, пока гость заполнит форму.
В Telegram и CRM приходит не просто контакт, а лид с ролью, задачей и историей разговора. Менеджеру есть с чем работать.
Виджет — это статический JS. Никаких SDK, фреймворков и серверной интеграции на стороне сайта. Подключается за вечер.
Бот вступает в разговор с теми, кто никогда не заполнил бы форму и не позвонил бы. Это новый источник заявок, а не замена существующих.
Тон, скоуп и правила общения заданы в промпте. Бот не выдумывает факты и не уходит от темы продукта.
LLM можно развернуть локально через Ollama, векторную базу — внутри периметра. Данные посетителей не уходят к внешним сервисам.
Вопрос посетителя → поиск в базе знаний (RAG) → ответ от LLM с опорой на ваш контент → продвижение по воронке: знакомство, квалификация, предложение демо, сбор контакта. Бот не просто отвечает — он доводит диалог до результата.
Транспорт: WebSocket. RAG: эмбеддинги (nomic-embed-text) + векторный поиск в Qdrant по проиндексированному контенту сайта. LLM: OpenAI-совместимый провайдер — OpenRouter или локальная Ollama. Воронка — машина состояний (знакомство → квалификация → демо → контакт) с tool-calling: бот сам вызывает capture_lead, offer_demo, escalate_to_operator. Лимиты токенов и сообщений на сессию.
Демо: вопрос посетителя → ответ из базы знаний → квалификация → сбор контакта.
Гость молчит — бот пишет первым. Контакт получен — лид уходит в Telegram.
Если посетитель замолчал, бот не ждёт пассивно: мягкое напоминание, затем уточняющий вопрос, затем закрывающее предложение. Как только контакт получен — лид с историей диалога параллельно уходит владельцу в Telegram и в Bitrix24.
Бот открыт в интернет, поэтому защита встроена в каждый запрос: классификатор токсичности, фильтр prompt-injection, guard от утечки промпта, rate-limiting. Лиды уходят в привычные каналы, метрики — в Prometheus.
Лид одновременно в Telegram владельцу и в Bitrix24 через входящий вебхук.
Сообщения, блокировки, лиды, этапы воронки, токены LLM — серии Prometheus.
Не справочное бюро: бот квалифицирует посетителя, снимает возражения и доводит до контакта или демо. Этап воронки бот выбирает сам.
RAG подмешивает ваш контент в каждый ответ. Бот опирается на факты с сайта, а не на догадки модели, и держит тон бренда.
ML-классификатор токсичности, фильтр prompt-injection, guard от утечки промпта, rate-limiting по IP и сессии, лимиты токенов.
LLM — локальная Ollama или OpenRouter. Векторная база и бэкенд разворачиваются в вашем контуре. Выбор за вами.
Двумя тегами в HTML — стили виджета и скрипт. Виджет появляется в правом нижнем углу и подключается к бэкенду по WebSocket. Адрес бэкенда, приветствие и тон задаются объектом конфигурации.
Не обязательно — бот работает и на одном системном промпте. Но для точных ответов о продукте контент сайта индексируется в Qdrant, и бот отвечает, опираясь на ваши материалы.
Когда посетитель оставляет контакт, бот фиксирует лид и параллельно отправляет его в Telegram владельцу и в Bitrix24 через входящий вебхук. Каналы подключаются независимо.
Любую OpenAI-совместимую: OpenRouter в облаке или локальную модель через Ollama в закрытом контуре. Провайдер и модель настраиваются переменными окружения.
Да. ML-классификатор токсичности отсекает абьюз, регулярные выражения ловят prompt-injection, guard не даёт раскрыть системный промпт, rate-limiting ограничивает частоту, действуют лимиты токенов и сообщений на сессию.
Сервис на Go: WebSocket-транспорт, агентский цикл с tool-calling, RAG поверх Qdrant, классификатор токсичности отдельным сервисом. Деплой — Helm chart и ArgoCD в Kubernetes, метрики — ServiceMonitor для kube-prometheus-stack.
Скрипт извлекает FAQ и смысловые блоки страниц, режет на пассажи, считает эмбеддинги (nomic-embed-text) и заливает в коллекцию Qdrant. Переиндексация идемпотентна и не требует перезапуска бэкенда.
Серверный таймер бездействия с тремя порогами: мягкое напоминание, контекстный вопрос, закрывающее предложение. Количество проактивных реплик на сессию ограничено, чтобы не быть навязчивым.
Развернём бота под ваш продукт: проиндексируем контент сайта, настроим тон и воронку, подключим Telegram и CRM. Покажем живой диалог и то, как приходит лид.
Или просто откройте чат в правом нижнем углу — IAM.Bot ответит сам.