AI Data Storage (RAG)

Назначение
AI Data Storage (RAG) — это компонент платформы Нодуль, предназначенный для хранения и индексирования текстовых файлов, изображений и других источников знаний.
🧠 Этот инструмент в первую очередь предназначен для использования в связке с AI Agent — он предоставляет документы в виде чанков, которые агент может использовать при генерации ответов.
Основные сценарии использования:
- Загрузка и хранение структурированной или неструктурированной информации
- Генерация embedding-векторов для быстрого семантического поиска
- Обработка естественно-языковых запросов
- Подключение к ноде RAG Search внутри сценария
Как получить доступ
Функция доступна в боковом меню: Data Storage → AI Data Storage (RAG).

Создание хранилища
Нажмите Create Storage, чтобы открыть окно с настройками:

Заполните обязательные поля: Storage Name, Chunk Size, Chunk Overlap

Что такое Chunk Size и Overlap?
- Chunk Size — количество токенов в одном чанке. Чем меньше значение — тем выше точность, но больше чанков.
- Chunk Overlap — процент перекрытия между соседними чанками. Помогает сохранять контекст между частями текста.
Управление хранилищами
Созданные хранилища отображаются в таблице:

Поле | Описание |
Name | Название хранилища |
Chunk Size | Количество токенов на чанк |
Chunk Overlap | Процент перекрытия чанков |
Created | Дата создания |
Updated | Дата последнего изменения |
Загрузка файлов
Откройте выбранное хранилище, чтобы перейти к интерфейсу загрузки. Поддерживается drag-and-drop.

После загрузки:
- каждый файл обрабатывается и индексируется (Processing)
- отображается в таблице с размером и статусом
- редактирование и скачивание пока не поддерживаются

Узел: RAG Search
Чтобы использовать загруженные данные в сценарии, подключите ноду RAG Search из категории AI Agent → Actions

Основные поля (RAG Search)
Поле | Описание |
Storage | Выбор хранилища для поиска |
Question | Естественно-языковой запрос |
Top_k | Количество чанков, которые будут возвращены (по умолчанию: 5, максимум: 20) |
Как это работает
- Вы загружаете документ в storage
- Документ автоматически разбивается на чанки и индексируется
- RAG Search получает запрос и ищет совпадения по embedding-вектору
- Возвращаются сырые текстовые чанки, соответствующие запросу
Возможности и ограничения
Возможность | Статус |
OCR | Поддерживается (английский и русский) |
Загрузка изображений | Да, если на изображении есть текст |
Редактирование файлов | Пока нет |
Скачивание файлов | Пока нет |
Автоматическая индексация | Да |
Поддерживаемые форматы | PDF, TXT, JSON, MD, PNG, JPG и другие |
Загрузка через сценарий | Пока не поддерживается |
Technical Details
Parameter | Value |
Max file size | 20 MB (будет увеличено до 50 MB) |
Embedding model | Cloudflare + LlamaIndex |
Vector limit | 5 000 000 векторов на аккаунт |
Billing | Списание кредитов только при загрузке (PNP credits) |
Billing
- Кредиты списываются при загрузке файла
- Расчет ведется по страницам/чанкам
- Пример: 1 страница ≈ 6600 microcredits
- Запросы через RAG Search не тарифицируются дополнительно
🧪 RAG находится в бета-версии. Возможны изменения в логике работы, тарифах и поддерживаемых форматах.
Пример выполнения
Запрос на естественном языке поступает в ноду и возвращает список совпадающих чанков согласно значению top_k
.

Работа с AI Agent
Пример сценария, в котором AI Agent использует инструмент RAG Search:

Настройка prompt для агента
У агента установлен system prompt, который требует использовать RAG Search при запросе информации из документации:

Настройка инструмента RAG
Нода RAG Search подключена к агенту через fromAIAgent()
. Выбрано нужное хранилище, задан top_k
, и добавлено описание инструмента, которое помогает агенту понять его возможности.

Пример
- Пользователь отправляет вопрос агенту
- Агент обращается к RAG Search и получает релевантные чанки
- Агент формирует финальный ответ
- The agent composes and returns a final response
