Туториал RAG-система @Romashka_pro_bot

Туториал RAG-система @Romashka_pro_bot
19 Дек, 2024
время чтения: ≈ 10 мин
 

Введение

👋 Добро пожаловать в систему RAG (Retrieval-Augmented Generation), интегрированную с нашим Telegram-ботом с искусственным интеллектом @Romashka_pro_bot! Эта система позволяет работать с вашими уникальными данными (текстовыми, табличными и файлами изображений), извлекать из них релевантную информацию и отвечать на ваши вопросы, основываясь на этой релевантной информации.

Основные преимущества системы:

Подробнее о RAG-системе
 


Как начать пользоваться системой?

Краткое руководство:

Подробное руководство:

  1. Подпишитесь на Telegram-бота @Romashka_pro_bot.

  2. Безопасно пополните баланс в разделе Личный кабинет, командой '/lk' или кнопкой на клавиатуре бота.

    • Минимальная сумма пополнения — 249 рублей.

    • Баланс в любой момент должен быть не менее 100 рублей.

  3. После пополнения введите команду /rag для получения ссылки на мини-приложение.

Авторизация в мини-приложении


Как загрузить файл

  1. Нажмите на значок "📎" в мини-приложении и выберите файл.

  2. Убедитесь, что файл соответствует требованиям:

    • Поддерживаемые форматы: .txt, .docx, .odt, .doc, .xls, .xlsx.

    • Максимальный размер файла: 10 МБ.

  3. После успешной загрузки начнётся обработка, и вы получите уведомление о её завершении.

    • Если файл превышает лимит или его формат не поддерживается, система уведомит вас.


Как задавать вопросы

  1. Введите ваш вопрос в текстовое поле мини-приложения.
    Например, если ваш файл - договор поставки, то ваш вопрос может быть: «Какие условия оплаты указаны в договоре?». ВАЖНО: RAG-система не анализирует весь файл полностью (это очень очень дорого и, надо признаться, малоэффективно). Вместо этого система находит контекст с возможным ответом на ваш вопрос в ваших документах и предоставляет этот контекст модели ИИ, которая, в свою очередь, предоставляет ответ на основе контекста вашей уникальной информации. Поэтому вопрос "о чем этот файл" может остаться без правильного ответа.

  2. Что делает система:

    • Система "нарежит" ваш файл на множество документов.

    • Далее система использует подход RAG (Retrieval-Augmented Generation), чтобы найти релевантный документ в загруженном файле.

    • После нахождения подходящего контекста, он комбинируется с вашим вопросом для передачи модели.

  3. Как это работает:

    • Исходный вопрос пользователя:
      «Какие условия оплаты указаны в договоре?»

    • Поиск соответствующего документа:
      Система анализирует загруженный файл и выполняет:

«Счет должен быть оплачен в течение 10 рабочих дней после получения подписанного договора»
также будет считаться релевантной запросу.

Формирование запроса для модели:
Система передаёт модели текст:

  1. «Вопрос: Какие условия оплаты указаны в договоре?
    Контекст: Счет должен быть оплачен в течение 10 рабочих дней после получения подписанного договора.
    Ответ модели:

    • «В документе найден раздел 'Оплата', где указано: оплата производится в течение 10 дней после подписания акта.»

  2. Ограничения:

    • Вопросы не должны содержать непристойный контент.

    • Максимальная длина сообщения: 10 000 символов. Если ваш вопрос или контекст слишком длинный, попробуйте его сократить.


Учет стоимости

  1. Цена обработки файла:

    • Стоимость рассчитывается по токенам (1 токен = 0,0007 руб.).

    • Пример: файл размером 10 МБ (около 250 000 токенов) будет стоить не более 175 рублей.

    • Один и тот же файл может потребовать разное количество токенов в зависимости от его содержимого.

  2. Цена за вопросы:

    • Задание вопросов системе требует минимальных расходов, так как основной процесс обработки уже завершён.

  3. Пример расчёта:

    • Вы загрузили файл объёмом 5 МБ. Его обработка потребовала 75 000 токенов → 52,5 руб..

    • Вопрос длиной 1000 символов и ответ на 500 символов → около 1500 токенов → 1,05 руб.


Часто задаваемые вопросы

  1. Что делать, если баланс меньше 100 рублей?
    Операции с системой будут недоступны. Пополните баланс в разделе Личный кабинет.

  2. Как связаться с поддержкой?
    Введите команду /help в Telegram-боте @Romashka_pro_bot.

  3. Что делать, если модель даёт некорректный ответ?

    Иногда система может подобрать нерелевантный документ, что приводит к неточным ответам. В таких случаях:
    1. Попробуйте уточнить или переформулировать ваш вопрос.

    2. Убедитесь, что ваш файл содержит нужную информацию.


Заключение

Система RAG в Telegram-боте @Romashka_pro_bot — это удобный мобильный инструмент для работы с вашей уникальной информацией. Он позволяет автоматически добавлять модели данные, которые ей неизвестны. Попробуйте её уже сегодня!