Что это за инструмент
RAG (Retrieval-Augmented Generation) — это связка из поиска по корпусу документов и языковой модели. Запрос пользователя сначала превращается в семантический поиск по базе знаний, найденные фрагменты подставляются в промпт, и LLM формулирует ответ строго на их основе. Для производства это означает одно: техрегламенты, ГОСТы, паспорта и инструкции по эксплуатации оборудования, карты ТОиР и документы по охране труда становятся не архивом из PDF и бумажных папок, а поисковой системой, которая отвечает на естественном языке и прикладывает ссылку на конкретный пункт конкретного документа.
Ключевое отличие от «чат-бота, который что-то знает»: модель не придумывает ответ из своей памяти, а опирается на ваши документы. Если фрагмент не найден — корректная система честно отвечает «не найдено», а не галлюцинирует. Именно эта прозрачность делает подход применимым на производстве, где ошибка в процедуре — это риск для безопасности.
Какую задачу решает на производстве
Базовый сценарий — поиск нужной процедуры инженером, технологом или оператором. По данным IDC, на которые ссылается отраслевой разбор baobab soluciones, инженеры тратят до 30% рабочего дня на поиск разрозненных данных. LLM-wiki сокращает этот поиск с минут (а иногда десятков минут блужданий по папкам) до секунд: оператор спрашивает «какой момент затяжки для узла X по регламенту», и получает ответ со ссылкой на актуальную ревизию документа.
Второй эффект — устранение риска работы по устаревшей версии. В производственном обзоре HELLO PEOPLE прямо описана функция: каждый ответ содержит цитату с указанием исходного документа, номера ревизии и раздела. Система отвечает из единого актуального источника, а не из распечатки трёхлетней давности, лежащей у станка.
Что показывают открытые источники
Это не кейс KT.Team, а сводка публичных примеров и исследований.
В рецензируемом исследовании по обмену знаниями на производстве (PMC, изучали детергентный завод) собрали базу из заводских инструкций — эксплуатация оборудования, протоколы безопасности, контроль качества — и неструктурированных отчётов о проблемах с линии. На бенчмарке из 20 производственных вопросов GPT-4 показал 97,5% фактологической точности, 95% полноты и 0% галлюцинаций; более слабые модели заметно отставали. Отдельно отмечено: RAG показывал операторам релевантные фрагменты документов, чтобы те могли проверить ответ по первоисточнику. При этом исследование честно фиксирует и опасение пользователей: «если ответы неадекватны — вы рискуете безопасностью», то есть качество документов и проверяемость критичны.
Отраслевой разбор baobab soluciones описывает индустриальный RAG поверх техдокументации, чертежей, электросхем, нарядов и логов датчиков. Со ссылкой на Deloitte указано, что масштабирование предиктивного обслуживания и AI-ассистентов способно снижать число отказов оборудования до 70% и сокращать затраты на обслуживание примерно на 25%; в качестве публичного примера приводится Schaeffler с резким снижением незапланированных простоев за счёт мгновенного доступа к ремонтной документации.
Производственный гайд HELLO PEOPLE даёт практическую рамку: система подключается к SOP, рабочим инструкциям, мануалам ТОиР, чек-листам качества, OEM-документации, паспортам безопасности (SDS) и инженерным спецификациям; принимает PDF, Word, таблицы и сканы через OCR; на хорошо поддерживаемых документах точность по фактологическим вопросам обычно 90–95%.
Где проходит граница применимости
Главное ограничение во всех источниках формулируется одинаково: RAG настолько хорош, насколько хороши документы. Если регламенты устаревшие, противоречивые или плохо написаны — модель уверенно вернёт неверную информацию. Поэтому такой проект — это в первую очередь дисциплина управления документами и версиями, а уже потом выбор модели. На safety-critical вопросах ответ обязан сопровождаться ссылкой на первоисточник, а человек — иметь возможность проверить.
Из практики внедрений (тот же HELLO PEOPLE): proof of concept занимает 4–6 недель, прод — 8–14 недель с пилотом и итерациями, причём обязательный шаг — валидация ответов инженерами предприятия (human-in-the-loop).
Как это укладывается в подход KT.Team
KT.Team строит подобные решения слабосвязанными, а не монолитом. LLM-wiki не «вшивается» внутрь источников документации (DMS, PLM, файловые хранилища, 1С), а подключается к ним как отдельный поисково-генеративный слой. Бизнес-ценность двойная: отчуждаемость — решение можно передать между командами и подрядчиками без переписывания, потому что граница «источник документов / индекс / LLM / интерфейс» явная; и локальность изменений — замену модели или переиндексацию можно сделать, не трогая соседние системы. Это AI-native сценарий в чистом виде: агент сам ищет, цитирует и отвечает, а инженер вместо поиска занимается работой. Практики выкатки и наблюдаемости опираются на DORA и Google SRE, поэтому такой контур поднимает и сопровождает небольшая команда (3–7 человек).
Бизнес-эффект
Целевой процесс — поиск нужной процедуры инженером и оператором: с минут до секунд и без риска работы по устаревшей версии. Косвенные эффекты, подтверждённые открытыми источниками: возврат части из тех ~30% рабочего времени, что уходит на поиск, и снижение незапланированных простоев за счёт мгновенного доступа к ремонтной документации.