aisol/шешімдер/мұрағат бойынша іздеу (RAG)
шешім 2 / 8

Корпоративтік құжаттар мен ішкі мұрағаттар бойынша AI-іздеу

Корпоративтік құжаттардың миллиондаған беті бойынша — оның ішінде сканерленгендеріне де — семантикалық іздеу. Жүйе түйінді сөздер бойынша емес, сұраудың мағынасын түсінеді. Қолмен сағаттап іздеудің орнына 30 секундта жауап.

Кімге арналған: квазимемлекеттік сектор, мұнай-газ, заң фирмалары, банктер, сақтандыру компаниялары — мұрағаты 50 000 беттен асатын кез келген ұйым. AWS Bedrock + векторлық дерекқор негізінде құрамыз; деректер Kazakhtelecom Cloud-та немесе on-premise қалады.

мұрағат бойынша іздеу30 сек
«қауіпті нысанға рұқсат»семантикалық сұрау
№47-ВН регламенті12–14-беттер · 3 талапдереккөз
Экология министрлігінің хаты08.02.2024 · ЗБ мұрағатыскан · OCR
дереккөзге сілтемемен жауап · 1,2 млн бет бойынша
мәселелер

Жүйесіз не болады

!

Қажетті құжатты немесе норманы іздеу 30 минуттан бірнеше сағатқа дейін уақыт алады — қызметкер қалталарды қолмен қарап шығады.

!

Қызметкерлер жұмысты қайталайды: ұқсас жоба бұрын жасалғанын және шешім мұрағатта тұрғанын білмейді.

!

Сканерленген құжаттарды Windows/SharePoint іздеуі индекстемейді — олар бойынша іздеу физикалық тұрғыдан мүмкін емес.

!

Қызметкер кеткенде білім онымен бірге кетеді — оның материалдарына құрылымды қол жеткізу жоқ.

!

Заңдық және техникалық нормалар құжаттама томдарына «көміліп» қалады — нақты бапты қолмен табу мүмкін емес.

!

Әртүрлі қызметкерлер клиенттің бір сұрағына әрқалай жауап береді — құжаттарды есте сақтаған бойынша түсіндіреді.

пилот бағдарлары

Мақсатты көрсеткіштерді бастаудан бұрын белгілейміз

Көрсеткіштерді жұмыс басталмастан бұрын сізбен келісеміз. Қол жеткізбесек — нәтижеге дейін жұмыс істейміз немесе ақшаны пропорционалды түрде қайтарамыз.

80%-ға дейініздеу уақытын қысқарту — ұқсас RAG-енгізулер бойынша бағдар
барлық форматтармәтіндік PDF, DOCX, Excel және сканерленген материалдар
30 сек-тенсұрауға орташа жауап беру уақыты
AWS Bedrockмұрағат көлемі бойынша шектеусіз инфрақұрылым
жүйенің құрамы

Корпоративтік AI-іздеу қалай жұмыс істейді

Семантикалық іздеу

Сұраудың мағынасын түсінеді, түйінді сөздерді емес. «Қауіпті нысанға рұқсатты қалай ресімдеуге болады?» — әртүрлі құжаттардан барлық тиісті нормаларды табады.

Сүзгілер мен рубрикалау

Құжат түрі, күні, бөлімі, жобасы, авторы бойынша іздеу. Іріктемені секундтарда тарылту.

Сканерлер үшін OCR

Сканерленген PDF мен фотодан мәтінді танып алады. Әр материал бойынша OCR дәлдігін шынайы көрсетеді.

Қоймалармен интеграция

SharePoint, Google Drive, 1C, Confluence, файлдық серверлер. Деректерді көшіруді талап етпейді.

Көптілділік

Қазақ, орыс, ағылшын тілдері. Бір тілдегі іздеу басқа тілдегі құжаттарды табады.

Нұсқаларды салыстыру

Құжаттың екі нұсқасы арасында не өзгергенін көрсетеді. Нормативтік құжаттар мен шарттар үшін маңызды.

Бет нөмірі көрсетілген дереккөз

Әр жауап — құжатқа және бет нөміріне сілтемемен. Қызметкер бастапқы дереккөзді көреді.

Рөлдер бойынша қол жеткізу

Әркім тек құқығы бар нәрсені ғана көреді. Мұрағат кең қол жеткізу кезінде де қауіпсіз.

сценарий мысалы

Жүйеге қойылатын сұраулар мысалдары

СұрақБіздің ішкі регламенттерге сәйкес табиғат пайдалануға рұқсат алу үшін құжаттамаға қандай талаптар қойылады?
Жүйе2023 жылғы №47-ВН регламенті бойынша (12–14-беттер) мыналар талап етіледі: учаскені тексеру актісі, экологиялық сараптама, жергілікті атқарушы органмен келісу. Қосымша талап — Экология министрлігінің 08.02.2024 жылғы хаты (ЗБ мұрағатынан табылды). Екі құжатты да көрсетейін бе?
СұрақБізде «КазСтройМонтаж»-бен шарт болды ма және қандай талаптармен?
Жүйе3 шарт табылды: 2019, 2021 және 2023 жылдардан. Соңғысы — жабдықты монтаждауға мердігерлік шарт, 48 млн теңге, мерзімі 8 ай, қол қойылған актімен жабылған. Құжатты ашайын ба?
жиі қойылатын сұрақтар

Нені білу қажет

Көлемі бойынша техникалық шектеулер жоқ — AWS Bedrock қолданамыз. Нақты конфигурацияны техникалық бағалау кезеңінде сіздің көлеміңізге қарай таңдаймыз.
Жүйе сіздің корпоративтік қоймаңыздан қол жеткізу құқықтарын мұра етеді. Қызметкерде файлға қол жеткізу жоқ болса — ол оны іздеу арқылы көрмейді.
OCR төмен сапада да жұмыс істейді. Әр құжат үшін тану сапасының бағасын көрсетеміз; дәлдік төмен болса — белгілейміз және қайта сканерлеуді ұсынамыз.
Көлеміне байланысты. 100 000 құжаттан тұратын әдеттегі мұрағат — алғашқы индекстеудің 3–5 жұмыс күні. Жаңа құжаттар автоматты түрде қосылады.
Иә. Клиенттің серверлерінде жергілікті модельмен on-premise орналастыру қолжетімді. Деректер компанияның контурынан шықпайды.

Мұрағатыңыз бойынша іздеуді қосуға дайынсыз ба?

Сіздің 1 000 құжатыңызда тест жүргіземіз — 2 жұмыс күнінде өз деректеріңізде іздеу сапасын көрсетеміз. Пилот — 4–6 апта, нәтижені бірге өлшейміз.