aisol/решения/поиск по архиву (RAG)
решение 2 / 8

AI-поиск по корпоративным документам и внутренним архивам

Ответ за 30 секунд вместо часов ручного поиска — по миллионам страниц, включая сканы. Система понимает смысл запроса, а не ключевые слова.

поиск по архиву30 сек
«допуск на опасный объект»семантический запрос
Регламент №47-ВНстр. 12–14 · 3 требованияисточник
Письмо Минэкологии08.02.2024 · архив ЮДскан · OCR
ответ со ссылкой на источник · по 1.2 млн страниц
проблемы

Что происходит без системы

!

Поиск нужного документа или нормы занимает от 30 минут до нескольких часов — сотрудник вручную просматривает папки.

!

Сотрудники дублируют работу: не знают, что аналогичный проект уже делался и решение есть в архиве.

!

Отсканированные документы не индексируются поиском Windows/SharePoint — по ним поиск физически невозможен.

!

При уходе сотрудника знания уходят вместе с ним — нет структурированного доступа к его материалам.

!

Юридические и технические нормы «закопаны» в томах документации — найти конкретную статью вручную нереально.

!

Разные сотрудники отвечают на один вопрос клиента по-разному — трактуют документы по памяти.

ориентиры пилота

Целевые показатели фиксируем до старта

Показатели согласуем с вами до начала работ. Если не достигаем — работаем до результата или возвращаем деньги пропорционально.

до 80%сокращение времени на поиск — ориентир по аналогичным RAG-внедрениям
все форматытекстовые PDF, DOCX, Excel и отсканированные материалы
от 30 сексреднее время ответа на запрос
AWS Bedrockинфраструктура без ограничений по объёму архива
состав системы

Как работает корпоративный AI-поиск

Семантический поиск

Понимает смысл запроса, не ключевые слова. «Как оформить допуск на опасный объект?» — находит все релевантные нормы из разных документов.

Фильтры и рубрикация

Поиск по типу документа, дате, отделу, проекту, автору. Сужение выборки за секунды.

OCR для сканов

Распознаёт текст из отсканированных PDF и фото. Честно указывает точность OCR по каждому материалу.

Интеграция с хранилищами

SharePoint, Google Drive, 1С, Confluence, файловые серверы. Не требует переноса данных.

Многоязычность

Казахский, русский, английский. Поиск на одном языке находит документы на другом.

Сравнение версий

Показывает, что изменилось между двумя версиями документа. Критично для нормативки и договоров.

Источник с указанием страницы

Каждый ответ — со ссылкой на документ и номер страницы. Сотрудник видит первоисточник.

Доступ по ролям

Каждый видит только то, на что у него есть права. Архив безопасен даже при широком доступе.

пример сценария

Примеры запросов к системе

ВопросКаковы требования к документации для разрешения на природопользование согласно нашим внутренним регламентам?
СистемаПо регламенту №47-ВН от 2023 г. (стр. 12–14) требуется: акт обследования участка, экологическая экспертиза, согласование с местным исполнительным органом. Смежное требование — письмо Министерства экологии от 08.02.2024 (найдено в архиве ЮД). Показать оба документа?
ВопросБыл ли у нас договор с «КазСтройМонтаж» и на каких условиях?
СистемаНайдено 3 договора: 2019, 2021 и 2023 годов. Последний — подряд на монтаж оборудования, 48 млн тенге, срок 8 месяцев, закрыт подписанным актом. Открыть документ?
частые вопросы

Что нужно знать

Технических ограничений по объёму нет — используем AWS Bedrock. Конкретную конфигурацию подбираем под ваш объём на этапе технической оценки.
Система наследует права доступа из вашего корпоративного хранилища. Если у сотрудника нет доступа к файлу — он не увидит его через поиск.
OCR работает даже с низким качеством. Для каждого документа показываем оценку качества распознавания; при низкой точности — помечаем и рекомендуем пересканирование.
Зависит от объёма. Типичный архив 100 000 документов — 3–5 рабочих дней первичной индексации. Новые документы добавляются автоматически.
Да. Доступно on-premise развёртывание на серверах клиента с локальной моделью. Данные не покидают контур компании.

Готовы включить поиск по вашему архиву?

Проведём тест на 1 000 ваших документов — за 2 рабочих дня покажем качество поиска на ваших данных. Пилот — 4–6 недель, результат измерим вместе.