Одним из наиболее важных аспектов этой атаки является то, как злоумышленники сначала начали сотрудничать с Claude. Они не использовали программную уязвимость и не обходили элементы управления аутентификацией, а вместо этого использовали ввод подсказок (prompt injection), чтобы обойти защитные механизмы модели:
«Ключом была ролевая игра: злоумышленники-операторы утверждали, что они являются сотрудниками легитимных кибербезопасных фирм, и убедили Claude, что его используют для защитного тестирования кибербезопасности».
Ввод подсказок, с помощью которого злоумышленники используют инструкции в запросах для вызова вредоносного или нежелательного поведения модели, является риском номер один в списке OWASP Top 10 Risks для LLM-приложений, поскольку он представляет собой потенциальный «парадный вход» в корпоративные системы ИИ, требующий решительной защиты.
CrowdStrike поддерживает самую полную в отрасли таксономию ввода подсказок благодаря приобретению Pangea, отслеживая более 150 различных техник. Предприятия, которые создают и развертывают собственные системы ИИ, также должны осознать, что эти системы могут быть подвержены манипуляциям и использованы в качестве оружия с помощью ввода подсказок.
Традиционные средства контроля безопасности, такие как файерволы, антивирусы и контроль доступа, не защищают от злоумышленников, которые могут успешно убедить систему ИИ вернуть информацию или выполнить действие вопреки ее первоначальному назначению и ограничениям.
Это требует новой группы средств контроля безопасности, специально разработанных для систем ИИ: для обнаружения ввода подсказок, проверки контекста, фильтрации выходных данных и мониторинга поведения взаимодействий с ИИ. Предприятия должны внедрять защитные барьеры, которые проверяют легитимность запросов, подтверждают, что действия ИИ согласуются с авторизованными сценариями использования, и выявляют манипуляции системы ИИ для выполнения несанкционированных действий.
Плоскость атаки расширилась до семантического уровня. Мы потратили десятилетия на защиту конечных точек, приложений, сетей, учетных данных и облачных сред – теперь пришло время защищать это.
Компания iIT Distribution является дистрибьютором решений CrowdStrike в Украине, странах Восточной Европы, Средней Азии и Балтии. CrowdStrike – лидер индустрии киберзащиты, который активно внедряет передовые технологии искусственного интеллекта в свои решения.