11 мар. 2025 г.·7 мин чтения

Политика хранения данных ИИ для команд, использующих внешние API

Политика хранения данных ИИ для команд, использующих внешние API: понятные правила по подсказкам, ответам, логам и согласию, которые сотрудники смогут применять каждый день.

Содержание

Почему командам нужны правила хранения

Когда команда использует внешний AI‑API, данные компании покидают инструменты, которые вы контролируете, и попадают в систему третьей стороны. Это не всегда означает риск, но это значит, что нужны чёткие ограничения до того, как люди начнут вставлять реальную работу в подсказки.

Большинство проблем начинается из‑за привычек, а не злого умысла. Саппорт‑агент копирует письмо клиента в подсказку. Продавец добавляет заметки с звонка. Инженер вставляет лог ошибки, в котором всё ещё есть идентификаторы аккаунтов или токены. Люди делают это быстро, часто не задумываясь, потому что инструмент ощущается как чат‑окно.

Короткое письменное правило убирает догадки. Оно говорит, что можно вставлять, что нужно сначала удалить и как долго подсказки, ответы и логи должны храниться в ваших системах. Одно простое правило, которого все придерживаются, лучше пяти расплывчатых рекомендаций.

Самая безопасная политика обычно самая простая: храните меньше данных и меньше времени. Если вы не храните чувствительные подсказки месяцами, никто не сможет случайно их раскрыть позже. Если вы удаляете имена, почты и внутренние ID перед отправкой запросов, данные становятся менее полезными для тех, кто не должен их видеть.

Это не только задача для безопасности или юридического отдела. Малые компании нуждаются в тех же привычках: небольшие команды работают быстро и часто пропускают процессы, когда заняты. Одностраничная политика обычно достаточно замедляет рискованную часть, не замедляя работу.

Цель проста. Сделать безопасное поведение поведением по умолчанию, даже в спешке.

Какие данные появляются при использовании ИИ

Команды обычно отправляют в инструмент ИИ больше данных, чем думают. Один запрос в поддержку может содержать имя клиента, рабочий email, цену, детали контракта и заметки из CRM или чата. Если кто‑то вставляет полный тикет или документ в внешний модель, с ним обычно уходят и личные детали.

Ответ модели — тоже данные. Выдача может повторить исходные детали почти слово в слово. Она также может создать новые чувствительные тексты, например рекомендацию по возврату средств, сводку отзывов сотрудников или черновик сообщения, раскрывающий внутренние цены или юридические формулировки. Команды часто сосредотачиваются на вводе и забывают, что вывод требует той же осторожности.

Логи легко упустить из виду, потому что пользователи их не видят. Ваше приложение, API‑шлюз, трекер ошибок и инструменты мониторинга могут сохранять полные запросы, полные ответы, идентификаторы пользователей, метки времени, названия моделей и сообщения об ошибках. Во многих компаниях логи хранятся дольше, чем подсказки или ответы. Это часто делает их более серьёзным риском.

Записи согласия тоже важны. Если вы просите пользователей согласиться на функции с поддержкой ИИ, вы обычно сохраняете, кто согласился, когда и с чем именно. Это помогает при проверках и жалобах, но тоже содержит персональные данные и требует своего срока хранения.

Практичная политика ясно называет четыре категории данных:

подсказки, отправляемые в модель
ответы, возвращаемые моделью
системные логи, создаваемые во время запроса
записи согласия, связанные с человеком и используемой функцией

Если ваша команда не может указать для каждой категории, где она хранится, кто видит данные и когда они удаляются, политика не закончена.

Правила для подсказок

Подсказки могут содержать гораздо больше приватных данных, чем люди ожидают. Один вставленный лог ошибки, фрагмент контракта или заметка о клиенте может раскрыть информацию, которую команда не намеревалась отправлять в стороннюю службу.

Обращайтесь с подсказками как с деловыми записями только если есть явная причина их сохранять. Если нет причин для аудита, безопасности или качества — не сохраняйте их вовсе.

Начните с жёсткого правила: сотрудники не должны вставлять секреты, данные карт, медицинские сведения или юридические файлы в внешний AI‑API, если конкретное использование не одобрено менеджером или ответственным за конфиденциальность. Это правило должно покрывать API‑ключи, пароли, внутренние токены, приватные договоры, медицинские заметки и всё, что идентифицирует человека в чувствительном контексте.

Перед отправкой подсказки её нужно очистить. Удалите имена, номера аккаунтов, адреса электронной почты, телефоны и номера заказов, если только для утверждённой задачи они действительно не нужны. Агент поддержки должен отправить «Клиент не может войти в аккаунт после сброса пароля» вместо «Джейн Миллер, аккаунт 482991, не может войти после сброса пароля.»

Если вы всё же храните подсказки, держите причину узкой. Большинству команд хранение подсказок нужно лишь в нескольких случаях: обзор качества, расследование инцидентов, проверки соответствия или тестирование подсказок во время короткого пилота.

Держите период хранения по умолчанию коротким. Для многих команд 30 дней достаточно. Если кому‑то нужно хранить дольше для регулируемого случая, задокументируйте причину, назначьте владельца и установите конечную дату.

Когда окно проверки закончится, удаляйте сохранённые подсказки автоматически. Не полагайтесь на ручную очистку. Если логи подсказок лежат месяцами, люди начнут использовать их как бесплатный архив — и это быстро создаёт проблему с конфиденциальностью.

Правила для ответов

Ответ ИИ может стать деловой записью в тот момент, когда кто‑то использует его в реальном рабочем процессе. Если вывод содержит данные клиента, информацию о сотруднике, формулировки договора или историю поддержки, обращайтесь с ним так же, как с исходным материалом.

Храните ответы только когда ими действительно пользуются. Черновик письма клиенту, сводка, добавленная в тикет, или заметка в внутренних документах — всё это может требовать хранения. Пять альтернативных черновиков, которыми никто не воспользовался, обычно не нужны. Старые тексты ИИ быстро накапливаются и могут вызвать юридические и приватные проблемы.

Простое правило работает хорошо:

Сохраняйте финальный вывод, который попал в тикет, CRM, документ или продукт.
Все остальные тексты ИИ помечайте как черновики по умолчанию.
Удаляйте неиспользуемые черновики по фиксированному графику, например через 7, 14 или 30 дней.
Храните владельца, дату и цель вместе с любым сохраняемым выводом.

Человеческая проверка особенно важна, когда вывод может повлиять на человека. Это включает заметки при найме, оценку производительности, решения по поддержке, сообщения о возврате денег, юридические формулировки и всё, что может раскрыть личные данные. Кто‑то должен проверить факты, тон и не повторяет ли текст лишние детали.

Используйте простой тест. Если вывод может быть процитирован позже в жалобе, аудите или споре, сохраните утверждённую версию и зафиксируйте, кто её утвердил. Если никто не воспользовался текстом, удаляйте его по графику.

Правила для логов

Put Retention Rules to Work

Have Oleg review masking, storage, and consent in one real workflow.

Talk to Oleg

Если вызов модели упал в 2 часа ночи, команде нужны подробности для трассировки. Но вам не нужна полная копия каждой подсказки и каждого ответа, хранящаяся в логах месяцами.

Логи должны быть инструментом для отладки и подотчётности, а не вторичным хранилищем. Начните с метаданных по умолчанию и сохраняйте сырой контент только для короткой, конкретной причины, например отладки сломанного рабочего процесса.

Для большинства команд нормальная запись лога должна включать:

ID запроса
имя и версию модели
время, код статуса и задержку
количество токенов и оценку стоимости
внутреннюю функцию или сервис, который сделал вызов

Этого обычно достаточно инженерам, чтобы заметить лимиты запросов, повторные попытки, резкие скачки расходов или изменение модели, которое ухудшило качество вывода.

Если ваше приложение обрабатывает личные или чувствительные данные, маскируйте их перед записью в хранилище. Заменяйте email‑адреса, телефоны, номера аккаунтов, имена и поля свободного текста на редактированные значения или стабильные хэши. Делайте это на уровне приложения, а не позже. Как только сырые данные попадают в лог‑пайплайн, очистка становится сложной.

Ограничьте доступ. Обычно видеть логи должны лишь люди, поддерживающие интеграцию, один ответственный по безопасности и один резервный сотрудник. Служба поддержки и продуктовые команды редко нуждаются в сырых технических логах.

Используйте разные сроки хранения для разных типов логов. Дебажные логи должны истекать быстро, часто в пределах 7–14 дней. Аудитные логи могут храниться дольше, потому что они отвечают на простые вопросы вроде кто сделал запрос, когда и успешно ли он прошёл. Делайте эти аудитные записи тонкими и избегайте хранения полных подсказок там, если только для юридической или безопасности причины это явно не требуется.

Как запрашивать согласие

Согласие работает лучше всего, когда вы спрашиваете простыми словами и прямо перед тем, как данные покинут вашу систему. Если сообщение пользователя, файл или поле формы уходит к внешнему AI‑провайдеру, скажите об этом прямо. Укажите, какой тип данных вы отправляете, зачем и как долго храните подсказку, ответ и связанные логи.

Расплывчатое уведомление не годится. Строка, спрятанная в условиях использования, не поможет, если задача включает персональные данные. Поместите уведомление рядом с самим действием — например флажок перед загрузкой или короткое сообщение над кнопкой отправки.

Ясное уведомление о согласии должно отвечать на четыре вопроса:

какие данные вы отправляете стороннему провайдеру ИИ
зачем вы это делаете
как долго храните подсказку, ответ и логи
как пользователь может запросить удаление или выбрать путь без ИИ

Дайте людям реальный выбор, когда задача требует персональных данных. Если шаг с ИИ необязателен, позвольте продолжить без него. Если шаг с ИИ обязателен, скажите об этом прямо и по возможности предложите ручной путь. Команда поддержки, например, может предложить два варианта: «Использовать ИИ для быстрого черновика» или «Отправить на ручную проверку человеком».

Ведите запись согласия. Сохраняйте дату, цель и версию уведомления, которое видел пользователь. Это важно, если позже человек спросит, с чем он соглашался, или если вы обновите текст.

Ваша политика хранения должна соответствовать потоку согласия. Не обещайте удаления, если ваша команда не может фактически убрать подсказки, ответы или логи из используемых систем. Если удаление имеет ограничения, объясните их простыми словами. Люди обычно легче принимают честное ограничение, чем расплывчатое обещание.

Как внедрить политику на практике

Начните с простого инвентаря. Большинство команд помнят основной чат‑бот и забывают виджет поддержки, форму обратной связи, помощника по продажам или скрипт, который отправляет текст во внешнюю модель в фоне. Если данные покидают вашу систему, внесите этот инструмент в список.

Затем просмотрите каждое поле, которое эти инструменты могут отправлять. Держите метки простыми: разрешено, маскировать или блокировать. Описание товара может быть разрешено. Адрес электронной почты может требовать маскировки. Пароли, платежные данные, приватная медицинская информация и государственные ID обычно нужно полностью блокировать от подсказок.

Небольшая таблица отслеживания достаточна. Для каждого инструмента или рабочего процесса отметьте, какие данные он отправляет, какие поля разрешены, маскируются или блокируются, где хранятся подсказки, ответы и логи, и кто владеет настройкой.

После этого выберите фиксированные сроки хранения. Не давайте каждой команде решать на ходу. Один срок для подсказок, один для ответов и один для логов упрощают соблюдение политики. Например, можно хранить подсказки 7 дней, ответы 30 дней если они нужны сотрудникам для работы, а логи 14 дней для отладки.

Затем автоматизируйте удаление. Ручная очистка проваливается, как только люди заняты. Добавьте задания на расписание удаления, проверьте, что бэкапы следуют тем же правилам, и назначьте одного владельца для каждой системы. Если у бота нет владельца, его данные никто не удаляет.

Обучение держите практичным. Покажите сотрудникам два‑три примера из повседневной работы: безопасную подсказку, подсказку, которую нужно маскировать, и подсказку, которую нельзя отправлять. Это работает лучше длинного документа, который никто не читает.

Быстрый тест покажет, работает ли система. Попросите человека вне команды проследить одну подсказку от формы до удаления. Если он не справится за несколько минут, политика живёт на бумаге, а не в системе.

Простой пример из поддержки

Tighten Prompt Handling

Remove names, IDs, and secrets before staff send data to outside models.

Set Rules

Сотрудник поддержки открывает тикет о задержке заказа и использует внешний AI‑API, чтобы набросать ответ. Инструмент не отправляет сырой тикет как есть. Перед отправкой подсказки форма удаляет имя клиента и номер заказа.

Подсказка, которая попадает в API, короткая и обобщённая. Она может звучать так: «Клиент спрашивает, почему посылка задерживается; нужен короткий ответ с дальнейшими шагами.» Это даёт модели достаточно контекста, чтобы помочь, без передачи персональных данных.

После того как сотрудник проверил черновик, он редактирует его и отправляет финальное сообщение. Команда хранит этот финальный ответ в тикете, потому что это часть записи обслуживания. Черновые подсказки не хранятся долго. Система удаляет текст подсказки через 7 дней — это даёт короткое окно для отладки и предотвращает накопление сырого содержимого.

Логи остаются «тонкими». Приложение сохраняет ID запроса и количество токенов, но не полный текст подсказки или полного ответа. Если команде нужно проследить неудачный запрос, это всё ещё возможно, но при этом вы не выставляете текст клиента всем, кто может смотреть логи.

Иногда сотруднику нужно включить данные аккаунта, чтобы решить проблему. В таких случаях инструмент показывает короткое уведомление о согласии перед отправкой. Сотрудник подтверждает, что у клиента есть согласие, или переключается на обычный ответ без ИИ.

Вот как выглядит рабочая политика для поддержки: удаляйте прямые идентификаторы перед отправкой подсказок, храните финальное сообщение клиенту, удаляйте короткоживущие черновики и логируйте только то, что нужно для работы системы.

Ошибки, которые допускают команды

Самая распространённая ошибка проста: команды логируют всё, потому что это удобно. Полные подсказки, полные ответы, вложения и скопированные сообщения клиентов оказываются в логах приложений и панелях поставщиков. В тестировании это кажется безобидным. Через полгода никто не помнит, почему приватные данные до сих пор лежат в трёх местах.

Согласие часто исполняется неверно тихо. Всплывающее окно говорит, что компания может использовать ИИ «для улучшения сервисов», и этого должно хватить для всех сценариев. Большинство людей не понимают, означает ли это составление ответов, отправку их текста в внешнюю модель или хранение результатов для обучения. Если человек не может понять выбор за один быстрый взгляд, согласие слишком широкое.

Ещё одна ошибка — вставить политику поставщика в свои документы и на этом закончить. Условия поставщика описывают систему поставщика, а не ваш рабочий процесс. Ваша команда решает, что попадает в подсказку, какие ответы сохраняются, кто может экспортировать логи и как долго бэкапы хранят удалённые записи.

Тестовые среды — ещё одна слепая зона. Команда может очистить продакшен, но оставить старые дампы, снимки базы данных и примерные подсказки в стейджинге. Поддержка часто использует реальные тикеты для тестирования изменений подсказок.

Владение тоже ломается после запуска. Все предполагают, что кто‑то другой проверяет задания удаления, окна хранения и срок бэкапов. А затем политика говорит «удалять через 30 дней», а хранилище держит файлы год. Один человек должен владеть обзором, проводить его по расписанию и записывать, что реально было удалено.

Быстрая проверка перед запуском

Review Your AI Workflow

Map prompts, outputs, logs, and delete rules before they turn into a risk.

Book Review

Большинство проблем возникает из‑за мелких привычек, а не драматических сбоев. Кто‑то вставляет данные клиента в подсказку, другой включает подробные логи, и никто не решает, когда эти данные будут удалены.

Короткий обзор перед релизом ловит большинство таких случаев. Политике не нужны страницы юридического текста. Ей нужны ограничения, которые сотрудники могут объяснить и соблюдать.

Спросите у нескольких сотрудников, какие данные никогда не должны попадать во внешний AI‑инструмент. Они должны ответить без догадок.
Проверьте логи. Во многих случаях для отладки не нужен полный текст подсказки или ответа.
Просмотрите каждое поле, которое вы храните. У каждого пункта должна быть цель, владелец и дата удаления.
Протестируйте пользовательский поток. До отправки данных пользователи должны видеть простое уведомление о том, что вы отправляете, зачем и как долго храните это.
Назначьте одного утверждающего. Политика с пятью полувладельцами обычно означает отсутствие владельца.

Простой стандарт работает: если данные чувствительные, не отправляйте их, если нет письменной причины, уведомления для пользователя и плана с временным удалением. Это достаточно строго для большинства малых команд и достаточно просто, чтобы использовать под давлением.

Следующие шаги для небольшой команды

Малым командам удобнее одна понятная страница, чем длинный документ, который никто не читает. Напишите политику простыми словами. Сосредоточьтесь на четырёх вещах: что сотрудники могут вставлять в подсказки, как долго сохраняются ответы, какие логи вы храните и когда пользователю нужно сказать «да».

Потом выберите один реальный рабочий процесс на этой неделе. Возьмите что‑то обычное: ответы поддержки, заметки продаж или исследование продукта. Проследите данные с момента ввода пользователем до момента, когда ваша команда сохраняет результат. Почините самую большую утечку в первую очередь. Во многом команды вставляют слишком много сырых данных клиентов в внешний AI‑API или логи хранят больше текста, чем нужно.

Простой первый шаг выглядит так:

держите политику на одной странице
просмотрите одну живую AI‑задачу и перечислите каждую подсказку, ответ и лог, которые она создаёт
убирайте персональные или чувствительные данные из подсказок, если задача точно не требует их
проводите ежемесячную проверку сохранённых подсказок, ответов и логов
назначьте одного человека, который будет обновлять правила при изменении рабочего процесса

Эта ежемесячная проверка важнее, чем многие думают. Инструменты меняются, люди перенимают новые привычки, а старые настройки логов остаются месяцами. Тратьте 20 минут в месяц на проверку того, что ваши системы всё ещё сохраняют. Если история подсказок, кэш ответов или дебаг‑лог больше не помогает команде — удаляйте или сокращайте сроки хранения.

Держите первую версию скромной. Вам не нужен полный юридический пакет, чтобы начать. Нужна правило, которое команда сможет использовать в понедельник утром.

Если поток данных запутан, внешняя помощь может сэкономить время. Oleg Sotnikov at oleg.is работает как fractional CTO и советник стартапов, и такой обзор подходит для этой роли. Быстрый проход по вашим рабочим процессам покажет, где данные ИИ движутся, где логи хранят слишком много и где не хватает правил хранения.

Короткая политика, один реальный обзор рабочего процесса и ежемесячная очистка принесут больше пользы, чем отточенный документ, которым никто не пользуется.

Часто задаваемые вопросы

What should we never paste into an external AI prompt?

Не вставляйте пароли, API-ключи, токены, данные карт, медицинские сведения, юридические документы или любую информацию, которая называет человека в чувствительном контексте.

Если задаче нужен контекст, сначала уберите имена, адреса электронной почты, телефоны, номера аккаунтов и внутренние идентификаторы, если только утверждённый сценарий действительно не требует их.

How long should we keep prompts?

Начните с короткого окна хранения. Для многих команд 30 дней достаточно, а в некоторых случаях можно делать и короче.

Храните подсказки дольше только если есть письменное обоснование, назначенный владелец и конечная дата хранения.

Should we save AI outputs?

Сохраняйте только ту версию вывода, которую кто‑то действительно использовал в тикете, CRM, документе или рабочем процессе продукта.

Удаляйте неиспользуемые черновики по фиксированному графику, чтобы старые тексты ИИ не накапливались.

What should we keep in logs?

В большинстве логов достаточно: ID запроса, имя модели, время, статус, задержка, количество токенов, стоимость и внутренняя функция, которая сделала вызов.

Держите сырые подсказки и ответы вне логов, если только инженеру не нужно их видеть для короткого окна отладки.

Do small teams really need a consent notice?

Да, если пользовательские данные покидают вашу систему и идут в внешний AI‑сервис. Малые команды работают быстро, поэтому им нужны такие же чёткие правила, как и крупным компаниям.

Пишите простыми словами и спрашивайте согласие прямо перед действием, а не в длинных условиях использования, которые никто не читает.

Where should we show the consent notice?

Показывайте её рядом с действием, которое отправляет данные — например, над кнопкой отправки или перед загрузкой файла.

Объясните, что именно вы отправляете, зачем отправляете, как долго храните данные и может ли человек выбрать путь без ИИ.

Who should own the policy?

За политикой должен стоять один ответственный человек. Он проверяет окна хранения, задания на удаление, правила бэкапов и обновления политики при изменении рабочих процессов.

Если пять человек владеют политикой по‑полу, чаще всего это значит, что владелец отсутствует.

How do we start if our AI workflow already feels messy?

Начните с одного реального рабочего процесса, например ответов поддержки или заметок продаж. Проследите данные от формы до вызова модели, хранилища, логов и удаления.

Потом исправьте самую большую утечку — обычно это необходимость маскировать подсказки или урезать логи.

Do backups need the same retention rules?

Да. Правило удаления не работает, если бэкапы хранят те же данные месяцы спустя после удаления в приложении.

Согласуйте сроки хранения в бэкапах с вашей политикой и опишите допустимые ограничения простыми словами.

What is a good default policy for a support team?

Простой рабочий стандарт для службы поддержки: удаляйте имена и номера заказов перед отправкой подсказки, сохраняйте финальное сообщение клиенту в тикете, удаляйте черновики подсказок через короткий срок и храните в логах только метаданные.

Если сотруднику действительно нужны данные аккаунта, покажите явное уведомление и дайте возможность перейти на ручный, безИИ‑процесс.