AI Data Storage (RAG) – Latenode

Назначение

AI Data Storage (RAG) — это компонент платформы Нодуль, предназначенный для хранения и индексирования текстовых файлов, изображений и других источников знаний.

🧠 Этот инструмент в первую очередь предназначен для использования в связке с AI Agent — он предоставляет документы в виде чанков, которые агент может использовать при генерации ответов.

Основные сценарии использования:

Загрузка и хранение структурированной или неструктурированной информации

Генерация embedding-векторов для быстрого семантического поиска

Обработка естественно-языковых запросов

Подключение к ноде RAG Search внутри сценария

Как получить доступ

Функция доступна в боковом меню: Data Storage → AI Data Storage (RAG).

Создание хранилища

Нажмите Create Storage, чтобы открыть окно с настройками:

Заполните обязательные поля: Storage Name, Chunk Size, Chunk Overlap

Что такое Chunk Size и Overlap?

Chunk Size — количество токенов в одном чанке. Чем меньше значение — тем выше точность, но больше чанков.

Chunk Overlap — процент перекрытия между соседними чанками. Помогает сохранять контекст между частями текста.

Управление хранилищами

Созданные хранилища отображаются в таблице:

Поле	Описание
Name	Название хранилища
Chunk Size	Количество токенов на чанк
Chunk Overlap	Процент перекрытия чанков
Created	Дата создания
Updated	Дата последнего изменения

Загрузка файлов

Откройте выбранное хранилище, чтобы перейти к интерфейсу загрузки. Поддерживается drag-and-drop.

После загрузки:

каждый файл обрабатывается и индексируется (Processing)

отображается в таблице с размером и статусом

редактирование и скачивание пока не поддерживаются

Узел: RAG Search

Чтобы использовать загруженные данные в сценарии, подключите ноду RAG Search из категории AI Agent → Actions

Основные поля (RAG Search)

Поле	Описание
Storage	Выбор хранилища для поиска
Question	Естественно-языковой запрос
Top_k	Количество чанков, которые будут возвращены (по умолчанию: 5, максимум: 20)

Как это работает

Вы загружаете документ в storage

Документ автоматически разбивается на чанки и индексируется

RAG Search получает запрос и ищет совпадения по embedding-вектору

Возвращаются сырые текстовые чанки, соответствующие запросу

Возможности и ограничения

Возможность	Статус
OCR	Поддерживается (английский и русский)
Загрузка изображений	Да, если на изображении есть текст
Редактирование файлов	Пока нет
Скачивание файлов	Пока нет
Автоматическая индексация	Да
Поддерживаемые форматы	PDF, TXT, JSON, MD, PNG, JPG и другие
Загрузка через сценарий	Пока не поддерживается

Technical Details

Parameter	Value
Max file size	20 MB (будет увеличено до 50 MB)
Embedding model	Cloudflare + LlamaIndex
Vector limit	5 000 000 векторов на аккаунт
Billing	Списание кредитов только при загрузке (PNP credits)

Billing

Кредиты списываются при загрузке файла

Расчет ведется по страницам/чанкам

Пример: 1 страница ≈ 6600 microcredits

Запросы через RAG Search не тарифицируются дополнительно

🧪 RAG находится в бета-версии. Возможны изменения в логике работы, тарифах и поддерживаемых форматах.

Пример выполнения

Запрос на естественном языке поступает в ноду и возвращает список совпадающих чанков согласно значению top_k.

Работа с AI Agent

Пример сценария, в котором AI Agent использует инструмент RAG Search:

Настройка prompt для агента

У агента установлен system prompt, который требует использовать RAG Search при запросе информации из документации:

Настройка инструмента RAG

Нода RAG Search подключена к агенту через fromAIAgent(). Выбрано нужное хранилище, задан top_k, и добавлено описание инструмента, которое помогает агенту понять его возможности.

Пример

Пользователь отправляет вопрос агенту

Агент обращается к RAG Search и получает релевантные чанки

Агент формирует финальный ответ

The agent composes and returns a final response