Cyber IA: guide complet pour sécuriser les agents IA autonomes

Aperçu de la situation

La sécurité IA agentique protège les systèmes autonomes capables de planifier et d'agir de manière indépendante, ce qui nécessite des contrôles allant au-delà des approches traditionnelles de sécurité IA/ML.
Le Top 10 OWASP pour les applications agencées 2026 établit des catégories de menaces conformes aux normes de l'industrie, notamment le détournement d'objectifs, l'utilisation abusive d'outils et l'usurpation d'identité.
Le cadre Lethal Trifecta identifie les situations où des risques cumulés apparaissent : accès à des données sensibles combiné à une exposition à des contenus non fiables et à une capacité de communication externe.
Les identités non humaines (NHI) sont aujourd'hui 50 fois plus nombreuses que les identités humaines dans les entreprises, ce qui fait de la gouvernance des identités des agents IA une priorité absolue en matière de sécurité.
Des attaques réelles ont généré des CVE critiques avec des scores CVSS de 9,3 à 9,4 sur les plateformes ServiceNow, Langflow et Microsoft Copilot entre 2025 et 2026.

La première cyberattaque orchestrée par une IA et documentée a eu lieu en septembre 2025, lorsqu'un groupe soutenu par l'État chinois a manipulé Claude Code pour infiltrer environ 30 cibles mondiales parmi des institutions financières, des agences gouvernementales et des fabricants de produits chimiques. Il ne s'agissait pas d'un exercice théorique. Selon les informations divulguées par Anthropic, les attaquants ont démontré que les agents IA autonomes pouvaient être utilisés à grande échelle comme armes sans intervention humaine significative. Il s'agit là d'une nouvelle catégorie de menaces persistantes avancées contre lesquelles les équipes de sécurité doivent se préparer à se défendre. Pour les équipes de sécurité, le message est clair : la sécurité IA agentielle est passée du statut de préoccupation émergente à celui d'impératif opérationnel.

Les enjeux sont considérables. Gartner prévoit que 40 % des applications d'entreprise intégreront des agents IA spécifiques à certaines tâches d'ici fin 2026, contre moins de 5 % en 2025. Pourtant, 80 % des professionnels de l'informatique ont déjà vu des agents IA effectuer des actions non autorisées ou inattendues. L'écart entre la vitesse d'adoption et la maturité en matière de sécurité crée une surface d'attaque que les adversaires exploitent activement.

Ce guide fournit aux professionnels de la sécurité une compréhension approfondie des menaces liées à l'IA agentique, des cadres d'évaluation et des conseils pratiques de mise en œuvre pour protéger les systèmes autonomes.

Qu'est-ce que la sécurité IA agentique ?

La sécurité des IA agentiques consiste à protéger les agents IA autonomes contre les cybermenaces tout en veillant à ce qu’ils fonctionnent en toute sécurité dans des limites de sécurité définies. Contrairement aux applications d’IA traditionnelles qui génèrent des résultats destinés à être examinés par des humains, les systèmes d’IA agentiques peuvent accéder de manière autonome aux ressources de l’entreprise, utiliser des outils externes, exécuter des flux de travail et prendre des décisions ayant un impact concret sur l’activité. La sécurisation de ces systèmes nécessite de protéger l’ensemble de l’écosystème des agents, y compris les identités, la mémoire, les outils, les API et le comportement en exécution.

Le principal défi en matière de sécurité consiste à trouver un équilibre entre autonomie et contrôle tout en préservant les limites de confiance. Lorsqu'un agent IA peut décider de manière indépendante d'accéder à une base de données, de rédiger un document et de l'envoyer par e-mail à une partie externe, la validation traditionnelle des entrées et sorties devient insuffisante. Les équipes de sécurité doivent prendre en compte l'ensemble de l'écosystème de l'agent, y compris les outils, la mémoire, la logique d'orchestration et les autorisations d'identité.

Pourquoi est-ce important aujourd'hui ? La rapidité de l'adoption signifie que la plupart des entreprises exploiteront plusieurs agents IA d'ici 18 mois. Les organisations qui ne parviennent pas à établir dès maintenant les bases de la sécurité seront confrontées à des risques croissants à mesure que le déploiement des agents s'étendra à toutes les fonctions de l'entreprise.

Sécurité IA agentique vs sécurité IA traditionnelle

Les différences fondamentales entre la sécurisation des systèmes d'IA traditionnels et celle des systèmes d'IA agentique proviennent de leur architecture et de leurs capacités.

La sécurité traditionnelle de l'IA se concentre sur l'intégrité des modèles, la protection des données d'entraînement et les attaques au moment de l'inférence. La surface d'attaque est relativement limitée. Les données d'entrée sont saisies, les données de sortie sont générées. Les contrôles de sécurité visent principalement à empêcher les données d'entrée malveillantes de manipuler les prédictions des modèles et à garantir que les pipelines d'entraînement restent intacts.

L'IA agentique élargit considérablement la surface d'attaque. Ces systèmes se caractérisent par l'utilisation dynamique d'outils, des chaînes de raisonnement en plusieurs étapes, des communications externes et une mémoire persistante d'une session à l'autre, suivant des modèles similaires à ceux de la chaîne de cyberattaque. Un attaquant n'a pas besoin de compromettre le modèle sous-jacent. La manipulation de n'importe quel composant de l'écosystème de l'agent peut rediriger le comportement vers des résultats malveillants.

Tableau 1 : Comparaison des considérations de sécurité entre l'IA traditionnelle et l'IA agentique

Aspect	IA traditionnelle	IA agentique
Surface d'attaque	Entrées et sorties du modèle	Écosystème complet d'agents, y compris les outils, la mémoire et l'orchestration
Menaces principales	Entrées adversaires, empoisonnement de modèle	Détournement d'objectif, utilisation abusive d'outils, usurpation d'identité, empoisonnement de la mémoire
Limites de contrôle	E/S bien définies	Dynamique, dépendant du contexte
Modèle d'identité	Hérité de l'application appelante	Nécessite une gouvernance indépendante de l'identité non humaine
Impact réel	Erreurs de prédiction	Actions non autorisées ayant des conséquences commerciales
Approche de surveillance	Validation des entrées/sorties	Analyse comportementale, journalisation des décisions, contraintes d'action

Les implications en matière de sécurité sont importantes. Les contrôles de sécurité traditionnels basés sur l'IA et axés sur la couche modèle sont nécessaires, mais insuffisants pour les systèmes agentiels. Les équipes de sécurité doivent étendre leur visibilité et leur contrôle à l'ensemble de l'architecture agentielle.

Pourquoi la sécurité de l'IA agentique est-elle cruciale ?

La sécurité des IA agentiques est devenue une priorité, car les agents IA autonomes interagissent directement avec les systèmes d'entreprise, les identités, les API, cloud et les données sensibles. Contrairement aux applications d'IA traditionnelles qui génèrent des résultats destinés à être examinés par des humains, les systèmes agentiques peuvent effectuer des actions de manière indépendante, ce qui offre aux attaquants la possibilité de manipuler les flux de travail, d'abuser des autorisations et de se déplacer latéralement au sein des environnements d'entreprise.

À mesure que les entreprises déploient davantage d'agents d'IA, la sécurisation de leurs identités, de leurs comportements et de leurs interactions devient tout aussi importante que celle des utilisateurs, des terminaux et cloud .

Comment fonctionne la sécurité basée sur l'IA agentique

Comprendre l'architecture des systèmes d'IA agentique permet de déterminer où les contrôles de sécurité doivent être appliqués. Les agents d'IA modernes combinent quatre composants principaux qui créent la surface d'attaque opérationnelle.

Composants de l'architecture de l'agent :

Couche modèle : le LLM sous-jacent qui fournit la capacité de raisonnement.
Couche outils : fonctions externes que l'agent peut invoquer, notamment les API, les bases de données, les systèmes de fichiers et les canaux de communication.
Couche mémoire : stockage persistant permettant à l'agent de conserver le contexte d'une session à l'autre.
Couche d'orchestration : logique qui coordonne la planification, la sélection des outils et le flux d'exécution.

Chaque couche présente des vulnérabilités distinctes. Les attaquants ciblent le composant qui offre le moins de résistance à leur objectif.

Le trio mortel expliqué

Le chercheur en sécurité Simon Willison a identifié trois facteurs qui, lorsqu'ils sont combinés, créent un risque grave, un cadre détaillé par Martin Fowler dans son analyse technique. La compréhension de ce cadre aide les équipes de sécurité à identifier les déploiements d'agents qui nécessitent les contrôles les plus stricts.

Le trio mortel comprend :

Accès à des données sensibles telles que les identifiants, les jetons, le code source, les documents internes et les informations personnelles identifiables qui pourraient permettre l'exfiltration de données.
Exposition à des contenus non fiables provenant de sources telles que des référentiels publics, des pages Web, des saisies utilisateur, des pièces jointes à des e-mails et des intégrations tierces.
Capacité à communiquer en externe par l'envoi d'e-mails, des appels API, des messages instantanés, des opérations sur des fichiers et l'exécution de code.

Lorsque ces trois conditions sont réunies simultanément, le risque augmente considérablement. Un agent ayant accès à des identifiants, traitant des pièces jointes non fiables et pouvant envoyer des communications externes crée une voie d'accès pour l'exfiltration de données, le vol d'identifiants et la compromission de la chaîne d'approvisionnement.

Tous les déploiements d'agents ne présentent pas ces trois caractéristiques. Les équipes de sécurité doivent évaluer chaque déploiement par rapport à ces critères et mettre en œuvre des contrôles proportionnels au profil de risque.

Comprendre l'architecture des agents et la surface d'attaque

Les attaquants exploitent différentes couches en fonction de leurs objectifs et de la configuration de l'agent.

Attaques au niveau de la couche modèle :

Prompt injection des instructions malveillantes dans les données d'entrée de l'agent
Le jailbreaking tente de contourner les contraintes de sécurité intégrées au modèle sous-jacent, à l'instar des techniques d'exploitation traditionnelles.

Attaques par couche d'outils :

L'utilisation abusive d'un outil consiste à exploiter les capacités légitimes d'un outil à des fins non autorisées.
L'extension du champ d'application incite les agents à utiliser des outils au-delà des limites prévues.
L'abus de ressources consomme des quotas de calcul ou d'API par le biais d'appels répétés.

Attaques de la couche mémoire :

L'empoisonnement de la mémoire corrompt le contexte persistant afin d'influencer les décisions futures.
La manipulation du contexte insère de fausses informations que l'agent considère comme faisant autorité.

Attaques au niveau de la couche d'orchestration :

Le détournement d'objectif redirige l'objectif de l'agent vers des résultats contrôlés par l'attaquant.
La manipulation du flux de travail modifie la logique d'exécution afin de contourner les étapes d'approbation.

La matrice Cyber IA AWS Agentic Cyber IA fournit un cadre permettant de classer les déploiements d'agents en fonction de deux dimensions : la connectivité (faible ou élevée) et l'autonomie (faible ou élevée). Cela crée quatre domaines, chacun nécessitant un niveau de contrôle de sécurité différent.

Présentation de la matrice de portée AWS :

Portée 1 (faible connectivité, faible autonomie) : agents internes disposant d'un accès limité aux outils. Une validation et une journalisation de base des entrées suffisent.
Portée 2 (connectivité élevée, faible autonomie) : agents connectés à Internet et supervisés par des humains. Nécessite une segmentation du réseau et une sécurité des API.
Portée 3 (faible connectivité, autonomie élevée) : agents internes dotés d'une capacité d'action indépendante significative. Nécessite des contraintes d'action et des workflows d'approbation.
Portée 4 (connectivité élevée, autonomie élevée) : agents autonomes connectés à Internet. Nécessite zero trust » complète et une surveillance continue.

Les organisations doivent commencer leurs déploiements dans les domaines 1 ou 2 et passer à des domaines plus élevés uniquement après avoir démontré leur maturité en matière de sécurité. La matrice de portée est référencée par l'OWASP, le CoSAI et plusieurs organismes de normalisation industriels comme cadre fondamental.

Le protocole MCP (Model Context Protocol) émergent, introduit par Anthropic, fournit une interface standardisée pour la communication entre les agents et les outils. Si le MCP améliore l'interopérabilité, il crée également de nouveaux vecteurs d'attaque. Les équipes de sécurité doivent vérifier l'intégrité du serveur MCP et surveiller les mouvements latéraux entre les agents et les outils connectés.

Cycle de vie de la sécurité de l'IA agentique

La sécurisation de l'IA agentique n'est pas une activité ponctuelle, mais un cycle de vie continu qui couvre la planification, le déploiement, l'exploitation et la mise hors service des agents d'IA autonomes. Chaque étape soulève des enjeux de sécurité spécifiques qui nécessitent une gouvernance, une surveillance et une validation permanentes.

Le cycle de vie type d'une IA agentique en matière de sécurité comprend six étapes :

Conception et évaluation des risques – Définir l'objectif de l'agent, ses limites de confiance, son niveau d'autonomie et ses besoins en matière d'accès avant son déploiement.

Gestion des identités et des accès – Attribuez à l'agent une identité dédiée (non humaine) dotée de droits d'accès minimaux, de contrôles d'authentification et de politiques de validation.

Déploiement et intégration – Assurer des intégrations sécurisées avec les modèles, les outils, les API, les systèmes de stockage en mémoire et les applications d'entreprise, tout en validant l'intégrité de la configuration et de la chaîne logistique.

Surveillance en temps réel et détection des comportements – Surveillez en permanence le comportement des agents, l'utilisation des outils, l'activité liée aux identités et les communications afin d'identifier prompt injection, détournement d'objectif, abus de privilèges, empoisonnement de la mémoire ou tout autre comportement anormal.

Réponse aux incidents et reprise après sinistre – Enquêter sur les activités suspectes des agents, révoquer les identités compromises ou les accès aux outils, restaurer les configurations fiables et vérifier que le comportement malveillant a bien été maîtrisé.

Amélioration continue – Affiner les mesures de protection, mettre à jour les politiques, réentraîner les modèles de détection, revoir les autorisations et intégrer les enseignements tirés à mesure que les agents évoluent et que de nouvelles menaces apparaissent.

‍

Risques et menaces liés à la sécurité de l'IA agentique

Le classement OWASP Top 10 pour les applications agentiques 2026, publié en décembre 2025, établit la taxonomie des menaces standard pour les systèmes d'IA agentique. Développé avec la contribution de plus de 100 chercheurs en sécurité et référencé par Microsoft, NVIDIA, AWS et GoDaddy, ce cadre fournit une classification faisant autorité des risques de sécurité liés à l'IA agentique.

Top 10 OWASP pour les applications agencées 2026

Le classement complet OWASP Top 10 pour les applications agencées identifie les catégories de risques suivantes :

ASI01 - Détournement des objectifs de l'agent : les attaquants manipulent les objectifs de l'agent en prompt injection en modifiant le contexte, afin de détourner des capacités légitimes vers des fins malveillantes
ASI02 - Utilisation abusive d'outils : exploitation d'outils d'agent à des fins non autorisées, y compris l'extension de la portée au-delà des limites prévues.
ASI03 - Abus d'identité et de privilèges : exploitation de permissions excessives, vol d'identifiants ou usurpation d'identité humaine conduisant à Usurpation de compte
ASI04 - Empoisonnement de la mémoire : corruption de la mémoire persistante d'un agent afin d'influencer ses décisions futures et de provoquer des défaillances en cascade.
ASI05 - Fuite de données : extraction non autorisée de données sensibles via les sorties d'agents, les journaux ou les réponses d'outils
ASI06 - Supply Chain : compromission des composants des agents, notamment les outils, les plug-ins, les serveurs MCP et les dépendances, dans le cadre d'attaques plus larges visant la chaîne logistique.
ASI07 - Manipulation des entrées : entrées conçues pour exploiter la logique d'analyse ou de traitement des agents
ASI08 - Autonomie excessive : actions des agents dépassant le cadre approprié sans surveillance adéquate
ASI09 - Journalisation et surveillance insuffisantes : observabilité inadéquate empêchant la détection des comportements malveillants des agents
ASI10 - Gestion non sécurisée des sorties : sorties d'agent qui permettent des attaques en aval ou contournent les contrôles de sécurité.

‍

Tableau 2 : Top 10 OWASP pour les applications agentées 2026

Identifiant du risque	Nom	Niveau d'impact	Atténuation primaire
ASI01	Détournement d'objectif par un agent	Critique	Validation des entrées, contraintes objectives
ASI02	Mauvaise utilisation des outils	Haut	Listes d'autorisation d'outils, contraintes de portée
ASI03	Identité et abus de privilèges	Critique	Privilège minimal, autorisation continue
ASI04	Empoisonnement de la mémoire	Haut	Isolation de la mémoire, validation de l'intégrité
ASI05	Fuite de données	Haut	Filtrage des sorties, intégration DLP
ASI06	Supply Chain	Critique	Vérification des fournisseurs, SBOM
ASI07	Manipulation des entrées	Moyenne	Nettoyage des entrées, validation des types
ASI08	Autonomie excessive	Moyenne	Autonomie progressive, workflows d'approbation
ASI09	Enregistrement insuffisant	Moyenne	Télémétrie complète, pistes d'audit
ASI10	Gestion non sécurisée des sorties	Moyenne	Validation des résultats, contrôles en aval

Chaque équipe de sécurité exploitant des systèmes d'IA agentique doit cartographier ses déploiements par rapport à ces catégories de risques et mettre en œuvre les contrôles appropriés.

Prompt injection les systèmes agentiques

Prompt injection une menace particulièrement dangereuse dans les contextes impliquant des agents, car ceux-ci peuvent exécuter des instructions qui ont été manipulées.

prompt injection directe consiste à insérer des instructions malveillantes directement dans les données saisies par l'utilisateur. Un pirate pourrait créer des données de saisie qui remplacent les instructions d'origine de l'agent par de nouveaux objectifs.

prompt injection indirecte est plus insidieuse. Les pirates intègrent des instructions cachées dans le contenu récupéré par l'agent. Les documents, les e-mails, les pages Web et les enregistrements de bases de données peuvent tous contenir des charges utiles qui s'activent lorsque l'agent les traite.

Les invites de deuxième ordre exploitent les architectures multi-agents. Dans les attaques documentées contre ServiceNow Now Assist, les pirates ont intégré des instructions malveillantes dans des champs de données qui semblaient inoffensifs pour l'agent de traitement initial, mais qui s'activaient lorsqu'ils étaient transmis à un agent disposant de privilèges supérieurs pour être exécutés.

En décembre 2025, OpenAI a déclaré que le problème de prompt injection serait prompt injection jamais entièrement résolu au niveau architectural. Cette reconnaissance de la part d'un développeur de premier plan dans le domaine de l'IA souligne la nécessité de mettre en place des défenses à plusieurs niveaux plutôt que de se fier à un seul et unique mécanisme de contrôle.

Une méta-analyse portant sur 78 études a révélé que prompt injection adaptative atteignent des taux de réussite supérieurs à 85 %. Même Claude Opus 4.5, conçu avec des mesures de sécurité renforcées, a affiché des taux de réussite supérieurs à 30 % face à des attaques ciblées, selon les tests menés par Anthropic.

Conséquence pratique : les organisations ne peuvent pas se contenter de se reposer uniquement sur des défenses au niveau des modèles. Les mesures de protection au moment de l'exécution, la validation des résultats et la surveillance comportementale constituent des compléments indispensables. prompt injection indirecte prompt injection permettre phishing à grande échelle, permettant d’extraire des identifiants ou des données sensibles par le biais d’interactions d’agents en apparence légitimes.

Attaques par empoisonnement de la mémoire

L'empoisonnement de la mémoire représente une menace émergente spécifique aux systèmes agissants qui conservent leur état d'une session à l'autre.

Le mécanisme d'attaque consiste à corrompre la mémoire persistante d'un agent avec des informations fausses ou malveillantes. Comme les agents considèrent leur contexte stocké comme faisant autorité, les mémoires empoisonnées influencent les décisions futures sans nécessiter d'exploitation répétée.

Une étude publiée en décembre 2025 par Galileo AI a démontré que 87 % des décisions en aval étaient compromises dans les quatre heures suivant le piratage initial de la mémoire. L'effet cascade signifie qu'un seul piratage réussi peut affecter des centaines d'interactions ultérieures de l'agent.

L'incident d'exfiltration de données de l'IA de Slack survenu en août 2024 a mis en évidence le phénomène de « memory poisoning » dans la pratique. Des chercheurs ont intégré prompt injection indirecte prompt injection dans des canaux privés de Slack. Lorsque l'assistant IA de Slack a traité ces canaux, il a commencé à exfiltrer des résumés de conversations vers des destinations contrôlées par les attaquants. Cela constitue une forme de menace interne rendue possible par l'IA, où l'agent devient un complice involontaire du vol de données.

Pour atténuer les risques liés à l'empoisonnement de la mémoire, il est nécessaire d'isoler la mémoire entre les domaines de confiance, de valider l'intégrité du contexte stocké et de surveiller les comportements afin de détecter les schémas décisionnels anormaux suggérant une compromission de la mémoire.

Gestion des identités non humaines pour les agents IA

Les identités non humaines (NHI) constituent la surface d'attaque qui connaît la croissance la plus rapide dans le domaine de la sécurité des entreprises. Selon une analyse du Forum économique mondial, les NHI sont aujourd'hui 50 fois plus nombreuses que les identités humaines dans les entreprises, et ce ratio devrait atteindre 80 pour 1 d'ici deux ans. Les agents IA représentent une nouvelle catégorie de NHI qui nécessite une gouvernance dédiée en matière de sécurité.

Les données du secteur indiquent que 97 % des violations de données liées à l'IA sont dues à une mauvaise gestion des accès. L'acquisition de SGNL par CrowdStrike pour 740 millions de dollars en janvier 2026 montre que les principaux fournisseurs de solutions de sécurité reconnaissent que l'IA agentique est fondamentalement un problème d'identité.

Les approches traditionnelles qui attribuent des autorisations aux agents en fonction de l'utilisateur qui les invoque créent une exposition excessive aux privilèges. Un agent effectuant des tâches de recherche n'a pas besoin du même accès qu'un agent traitant des transactions financières, même si le même utilisateur invoque les deux.

Mise en œuvre de la gouvernance des identités pour les agents IA

Une gouvernance efficace des agents IA dans le cadre du NHI nécessite de les traiter comme des identités de premier ordre avec une gestion indépendante de leur cycle de vie.

Phases du cycle de vie de l'identité :

Créer : établir l'identité de l'agent avec une propriété claire, une documentation sur l'objectif et une portée initiale des autorisations.
Gérer : examens réguliers des accès, ajustements des autorisations en fonction de l'évolution des besoins
Moniteur : analyse comportementale continue grâce à l'analyse d'identité afin de détecter les schémas anormaux
Mise hors service : procédures formelles de résiliation empêchant les agents zombies de rester actifs sans surveillance.

Principes de gouvernance :

Privilège minimal : accordez les autorisations minimales requises pour des tâches spécifiques, et non un accès général.
Accès juste à temps : privilèges limités dans le temps qui expirent automatiquement, nécessitant une nouvelle autorisation pour continuer à y avoir accès.
Autorisation continue : validation en temps réel que les agents restent dans le cadre autorisé tout au long de l'opération.
Gouvernance indépendante : autorisations des agents distinctes des autorisations des utilisateurs, avec des cycles de révision distincts

Le problème des agents zombies mérite une attention particulière. Les agents créés à des fins expérimentales ou pour valider un concept restent souvent actifs après la fin des projets. Ces agents conservent leur accès, consomment des ressources et élargissent la surface d'attaque sans propriétaire ni supervision. Des procédures officielles de mise hors service doivent faire partie intégrante du cycle de vie de chaque déploiement d'agent.

Incidents réels et études de cas

Le paysage des menaces pour l'IA agentique est passé du stade théorique à celui de l'opérationnel. Des vulnérabilités critiques avec des scores CVSS supérieurs à 9,0 ont été découvertes dans les principales plateformes d'entreprise, plusieurs d'entre elles étant activement exploitées dans la nature.

CVE critiques dans les systèmes d'IA agentique (2025-2026)

Tableau 3 : Vulnérabilités critiques dans les systèmes d'IA agentique (2025-2026)

Identifiant CVE	Produit	CVSS	Date de découverte	Statut de l'exploitation
CVE-2025-12420	Plateforme d'IA ServiceNow	9.3	Janvier 2026	Corrigé
CVE-2025-34291	Langflow	9.4	Avril 2025	Exploitation active (botnet Flodric)
CVE-2025-32711	Microsoft 365 Copilot	9.3	Juin 2025	Exploitation active

ServiceNow BodySnatcher (CVE-2025-12420)

La vulnérabilité « BodySnatcher » découverte dans la plateforme d'IA de ServiceNow permettait à des attaquants non authentifiés de se faire passer pour n'importe quel utilisateur, y compris les administrateurs, en utilisant simplement une adresse e-mail. L'exploit tirait parti d'un secret d'authentification codé en dur et d'un système de liaison de comptes trop permissif pour contourner l'authentification multifactorielle (MFA) et l'authentification unique (SSO), permettant ainsi aux attaquants de déclencher des workflows d'IA et de créer des comptes de type « porte dérobée » dotés de privilèges élevés. Les organisations utilisant des versions concernées de l'API Virtual Agent doivent vérifier immédiatement si les correctifs ont été installés.

Chaîne de vulnérabilité Langflow (CVE-2025-34291)

Langflow, un framework open source populaire pour agents IA, contenait une chaîne de vulnérabilités critiques permettant Usurpation de compte complète Usurpation de compte l'exécution de code à distance. Des paramètres CORS trop permissifs, combinés à l'absence de protection CSRF et à endpoint de validation de code non sécurisé, endpoint la voie d'attaque. Tous les jetons d'accès et clés API stockés ont été exposés, permettant une compromission en cascade de tous les services intégrés en aval. Le botnet Flodric exploite activement cette vulnérabilité.

Microsoft Copilot EchoLeak (CVE-2025-32711)

La vulnérabilité EchoLeak représente la première attaque zero-click documentée contre un agent IA. Les pirates intègrent des invites malveillantes dans du texte caché, des notes de présentation, des métadonnées ou des commentaires dans des documents Word, PowerPoint ou Outlook. Lorsque les victimes interagissent avec Copilot, des données sensibles de l'organisation, notamment des e-mails, des fichiers OneDrive, du contenu SharePoint et des messages Teams, sont exfiltrées via des paramètres d'URL d'image à l'insu de l'utilisateur et sans interaction de sa part.

Première cyberattaque orchestrée par l'IA

En septembre 2025, Anthropic a révélé la perturbation de la première cyberattaque à grande échelle documentée, exécutée par un agent IA sans intervention humaine significative. Un groupe soutenu par l'État chinois a manipulé Claude Code pour mener des opérations de reconnaissance, sélectionner des cibles et tenter de s'introduire dans environ 30 organisations dans les secteurs des services financiers, des administrations publiques et des infrastructures critiques.

Supply Chain PhantomRaven

Koi Security a découvert 126 paquets npm malveillants à l'aide d'une nouvelle technique appelée « Remote Dynamic Dependencies » (dépendances dynamiques à distance). Les paquets semblaient vides et inoffensifs dans le registre, mais ils récupéraient des charges utiles malveillantes à partir des serveurs des attaquants uniquement après leur installation. À l'aide de noms générés par IA grâce à une technique appelée « slopsquatting », ces paquets ont été téléchargés plus de 86 000 fois avant d'être détectés, exfiltrant des jetons npm, cloud et des clés SSH.

Ces incidents exigent des capacités de réponse robustes qui tiennent spécifiquement compte des vecteurs d'agents IA. Les équipes de sécurité doivent mettre à jour leurs manuels afin d'y inclure des procédures d'enquête spécifiques aux agents.

Détection et prévention des menaces liées à l'IA agentique

Le cadre MIT Sloan Three Essentials fournit une approche structurée de la sécurité de l'IA agentielle. Les organisations doivent mettre en œuvre une modélisation complète des menaces, des tests de sécurité continus et des protections d'exécution fonctionnant de concert.

Seuls 21 % des responsables de la sécurité déclarent avoir une visibilité complète sur les opérations des agents IA. Moins de 40 % effectuent régulièrement des tests de sécurité IA. Ce manque de visibilité représente à la fois un risque et une opportunité pour les équipes de sécurité de différencier leurs organisations grâce à des capacités améliorées de détection des menaces.

Contrôles de sécurité par AWS Portée de la matrice de portée

Adapter les contrôles à la complexité de l'architecture garantit une protection proportionnée sans entraver les opérations légitimes.

Portée 1 (faible connectivité, faible autonomie) :

Validation et nettoyage des données de base
Enregistrement complet des actions des agents
Filtrage des données sensibles en sortie

Portée 2 (connectivité élevée, faible autonomie) :

Segmentation du réseau isolant l'infrastructure des agents
Sécurité des API, y compris l'authentification et la limitation du débit
Surveillance des communications externes

Portée 3 (faible connectivité, autonomie élevée) :

Contraintes d'action limitant les capacités des agents à des limites définies
Workflows d'approbation pour les décisions à fort impact
Autonomie progressive avec augmentation de la confiance acquise

Portée 4 (connectivité élevée, autonomie élevée) :

Confiance zéro zero trust telle que décrite par Cisco
Surveillance continue avec analyse comportementale
Intervention humaine pour les actions irréversibles
Intégration de la détection des menaces en temps réel avec les plateformes SIEM

Mise en œuvre des garde-fous d'exécution

La protection multicouche en temps réel traite les menaces à chaque étape du fonctionnement de l'agent.

Protections de la couche d'entrée :

Prompt injection capables de détecter des séquences d'instructions malveillantes
Filtrage de contenu supprimant les charges utiles potentiellement dangereuses des entrées
Validation du schéma garantissant que les entrées correspondent aux formats attendus

Protections de la couche d'action :

Listes d'autorisation d'outils limitant les agents à des ensembles de fonctions approuvés
Contraintes de portée empêchant l'extension des capacités au-delà des limites définies
Limitation du débit empêchant l'abus des ressources par des appels excessifs aux outils

Protections de la couche de sortie :

Détection et masquage des informations personnelles identifiables pour éviter toute divulgation accidentelle de données
Filtrage des données sensibles supprimant les identifiants et les jetons des sorties
Validation des réponses garantissant que les résultats ne permettent pas d'attaques en aval

Les solutions proposées par les fournisseurs, notamment NVIDIA NeMo Guardrails, F5 et Straiker, offrent des implémentations commerciales. Les organisations peuvent également créer des garde-fous personnalisés à l'aide de cadres open source adaptés à leurs besoins spécifiques.

Pourquoi la détection comportementale est-elle importante pour l'IA agentique ?

Les contrôles préventifs, tels que le filtrage des invites, les mesures de protection à l'exécution et les processus de validation, réduisent le risque d'utilisation abusive des agents IA, mais ils ne peuvent pas empêcher toutes les attaques. Prompt injection, la compromission d'outils, le vol d'identifiants, l'empoisonnement de la mémoire et l'usurpation d'identité peuvent encore amener des agents autonomes à se comporter de manière inattendue ou non autorisée après leur déploiement.

La détection comportementale vient compléter les contrôles préventifs en surveillant en permanence la manière dont les agents IA interagissent avec les identités, les API, les applications d'entreprise, cloud et d'autres agents IA. Plutôt que d'évaluer isolément les invites ou les résultats, l'analyse comportementale établit une référence de l'activité attendue des agents et identifie les écarts susceptibles d'indiquer un détournement d'objectif, une utilisation non autorisée d'outils, des privilèges excessifs, une exfiltration de données ou un déplacement latéral.

À mesure que les organisations déploient un nombre croissant d'agents autonomes, la surveillance continue du comportement devient un élément fondamental de la sécurité de l'IA agentique. Associée à des garde-fous d'exécution, à la gouvernance des identités et au principe du privilège minimal, la détection comportementale permet aux équipes de sécurité d'identifier les agents compromis, d'enquêter sur les activités suspectes et de contenir les menaces avant qu'elles n'affectent les systèmes de l'entreprise.

Bonnes pratiques en matière de sécurité de l'IA agentique

Les équipes de sécurité doivent valider ces contrôles fondamentaux avant de déployer à grande échelle l'IA agentielle :

Traitez les agents IA comme des identités de premier ordre avec une gouvernance et une gestion du cycle de vie indépendantes.
Mettre en œuvre les principes du moindre privilège et de la moindre autonomie, en n'accordant que les autorisations nécessaires.
Déployez des outils d'observabilité avant de développer l'autonomie afin de garantir la visibilité sur les schémas comportementaux des attaquants.
Maintenir l'approbation humaine pour les actions irréversibles ou à fort impact
Créer des nomenclatures logicielles spécifiques à l'IA (SBOM) documentant tous les composants de l'agent.
Appliquez le principe zero trust la communication entre agents, en validant chaque interaction.
Mener régulièrement des exercices de recherche de menaces axés sur les modèles d'attaque spécifiques aux agents.
Intégrez la surveillance des agents aux workflows d'automatisation SOC existants.
Établir des procédures officielles de mise hors service pour les agents qui prennent leur retraite.

Conformité et cadres réglementaires

Les organisations doivent aligner leurs pratiques de sécurité en matière d'IA agentique sur les exigences réglementaires et les normes industrielles. Le paysage réglementaire a considérablement évolué fin 2025 avec la publication de textes importants traitant spécifiquement des systèmes d'IA autonomes.

Cadre réglementaire (janvier 2026)

Tableau 4 : Cadre réglementaire applicable à l'IA agentique (janvier 2026)

Réglementation	Date d'entrée en vigueur	Exigences clés	Pertinence
California SB 53 (TFAIA)	Janvier 1, 2026	Cadres de gestion des risques pour les grands développeurs d'IA ; signalement des incidents dans les 15 jours ; protection des lanceurs d'alerte	Haut
Texas TRAIGA	Janvier 1, 2026	Interdit les résultats nuisibles de l'IA, notamment ceux qui encouragent les cyberattaques ; bac à sable réglementaire.	Moyenne
Loi sur l'IA du Colorado (SB 24-205)	Juin 30, 2026	Évaluations d'impact pour les systèmes d'IA à haut risque	Moyenne
Profil cyber-IA du NIST	Projet (décembre 2025)	Cartographie CSF 2.0 pour la gouvernance de la sécurité IA	Haut

Le profil NIST Cyber AI, publié sous forme de projet préliminaire en décembre 2025, établit une correspondance entre les domaines prioritaires en matière de sécurité de l'IA et les fonctions du cadre de cybersécurité 2.0, notamment la gouvernance, l'identification, la protection, la détection, la réponse et la récupération. Bien qu'il ne soit pas réglementaire, ce cadre devrait devenir la norme de facto en matière de gouvernance de la sécurité de l'IA.

Le NIST a par ailleurs publié en janvier 2026 un appel à contributions visant à recueillir des avis sur les enjeux de sécurité liés aux systèmes d'agents IA, en abordant plus particulièrement prompt injection, l'empoisonnement des données et les objectifs inappropriés ayant un impact sur les systèmes du monde réel.

Références clés du cadre :

OWASP Top 10 pour les applications agencées 2026: taxonomie des menaces standard dans l'industrie
MITRE ATLAS: Ajout de 14 nouvelles techniques axées sur les agents en octobre 2025, couvrant désormais 66 techniques et 46 sous-techniques spécifiques aux systèmes d'IA. Voir également la couverture MITRE ATLASVectra AI.
MITRE ATT&CK: les TTP fondamentales des adversaires deviennent de plus en plus pertinentes à mesure que les attaquants exploitent les agents IA.
ISO/IEC 42001:2023 : première norme de certification des systèmes de gestion de l'IA

Les organisations doivent aligner leurs programmes de conformité afin d'intégrer ces cadres, en particulier les directives OWASP et MITRE qui fournissent des spécificités opérationnelles.

Approches modernes de la sécurité de l'IA agentique

Le paysage des fournisseurs de solutions de sécurité IA agentique s'est rapidement développé, avec des plateformes établies et des start-ups spécialisées proposant des solutions. L'approche axée sur l'identité a pris un essor particulier, les organisations reconnaissant que la sécurité des agents est fondamentalement un défi en matière de détection et de réponse aux menaces liées à l'identité.

De grands fournisseurs d'entreprise, notamment Palo Alto Networks avec Cortex AgentiX, CrowdStrike avec Falcon Agentic Security et SentinelOne avec Singularity AI SIEM, ont lancé des fonctionnalités de sécurité dédiées à l'IA agentique. L'acquisition de SGNL par CrowdStrike pour 740 millions de dollars vise spécifiquement les contrôles d'accès en temps réel pour les humains, les identités non humaines et les agents IA autonomes.

L'architecture de sécurité au niveau du navigateur est également apparue comme un point de contrôle. En décembre 2025, Google Chrome a introduit une architecture de défense multicouche pour la navigation agentique Gemini, comprenant un critique d'alignement utilisateur (modèle d'IA isolé vérifiant les actions proposées), des ensembles d'origine d'agent (limitant les interactions aux sites pertinents pour la tâche) et des confirmations obligatoires de l'utilisateur pour les actions sensibles.

L'écosystème des start-ups a attiré d'importants investissements. WitnessAI a levé 58 millions de dollars pour sa solution de gouvernance et d'observabilité de l'IA agentique. Geordie est sortie de l'ombre en levant 6,5 millions de dollars pour sa plateforme de sécurité basée sur des agents IA. Prophet Security a levé 30 millions de dollars pour sa plateforme SOC agentique.

Les organisations qui déploient l'IA agentique pour leurs opérations de sécurité font état de gains d'efficacité significatifs. Les données du secteur indiquent une réduction de 60 % du temps nécessaire au triage des alertes lorsque l'IA agentique se charge de l'enquête initiale et de l'enrichissement, libérant ainsi les analystes humains pour la prise de décisions complexes.

Comment Vectra AI la sécurité de l'IA agentique

Vectra AI la sécurité de l'IA agentielle sous l'angle du Attack Signal Intelligence, reconnaissant que, à mesure que les agents IA se multiplient sur les réseaux d'entreprise, ils deviennent à la fois des vecteurs d'attaque potentiels et des actifs précieux nécessitant une protection.

La philosophie du compromis s'étend naturellement aux systèmes agentiques. Plutôt que d'essayer d'empêcher toute utilisation abusive des agents par le seul biais de contrôles périmétriques, les organisations doivent se concentrer sur la détection rapide des comportements anormaux des agents, des utilisations non autorisées d'outils et des schémas d'usurpation d'identité.

Cela nécessite une observabilité unifiée sur l'ensemble de la surface d'attaque moderne, y compris les communications des agents IA, les appels d'outils et les actions d'identité. détection et réponse aux incidents doivent évoluer afin de distinguer les opérations autonomes légitimes des manipulations des attaquants. Les solutions ITDR doivent être étendues afin de couvrir les identités non humaines et les modèles d'abus de privilèges spécifiques aux agents.

L'objectif n'est pas d'empêcher l'adoption de l'IA, mais de permettre un déploiement sécurisé à grande échelle, en fournissant aux équipes de sécurité la visibilité et la clarté des signaux nécessaires pour opérer en toute confiance dans un environnement agentique.

Foire aux questions

Qu'est-ce que la sécurité IA agentique ?

La sécurité de l'IA agentique consiste à protéger les agents IA capables de planifier, d'agir et de prendre des décisions de manière autonome. Contrairement à la sécurité IA traditionnelle axée sur l'intégrité des modèles, la sécurité IA agentique traite la surface d'attaque élargie créée lorsque les systèmes IA peuvent accéder indépendamment à des outils, communiquer en externe et prendre des mesures ayant des conséquences dans le monde réel. Cette discipline englobe la modélisation des menaces spécifiques aux systèmes autonomes, les mécanismes de protection à l'exécution, la gouvernance des identités pour les agents IA et la détection des comportements anormaux des agents pouvant indiquer une compromission ou une manipulation.

Quels sont les principaux risques liés aux systèmes d'IA agentique ?

Le classement OWASP Top 10 pour les applications agencées 2026 identifie les principaux risques comme étant le détournement d'objectif de l'agent (ASI01), l'utilisation abusive des outils (ASI02), l'abus d'identité et de privilèges (ASI03), l'empoisonnement de la mémoire (ASI04) et Supply Chain (ASI06) parmi les plus critiques. Ces risques s'aggravent lorsque les agents présentent les trois conditions mortelles suivantes : accès à des données sensibles, exposition à des contenus non fiables et capacité de communication externe. L'exploitation de ces risques dans le monde réel a donné lieu à des CVE critiques avec des scores CVSS supérieurs à 9,0 sur les principales plateformes d'entreprise.

En quoi l'IA agentique diffère-t-elle de l'IA générative ?

L'IA générative crée du contenu, notamment du texte, des images et du code, mais fonctionne généralement selon un modèle requête-réponse, chaque interaction étant supervisée par un humain. L'IA agentique planifie et exécute de manière autonome des tâches en plusieurs étapes, utilise des outils pour interagir avec des systèmes externes, conserve la mémoire d'une session à l'autre et peut effectuer des actions dans le monde réel sans intervention humaine. Cette autonomie engendre des risques de sécurité qui vont au-delà de prompt injection incluent l'utilisation abusive d'outils, le détournement d'objectifs et l'usurpation d'identité. Alors que la sécurité de l'IA générative se concentre principalement sur la sécurité des résultats, celle de l'IA agentique doit prendre en compte l'ensemble de l'écosystème des agents.

Qu'est-ce que le « Lethal Trifecta » dans la sécurité de l'IA ?

Le « Lethal Trifecta », terme inventé par Simon Willison et détaillé par Martin Fowler, décrit trois facteurs qui, lorsqu'ils sont présents simultanément, créent un risque aggravé. Le premier facteur est l'accès à des données sensibles telles que les identifiants, les jetons et les documents confidentiels. Le deuxième est l'exposition à des contenus non fiables provenant de pages web, d'e-mails, de saisies utilisateur ou d'API externes. Le troisième est la capacité à communiquer vers l'extérieur par e-mail, messagerie ou appels API. Les équipes de sécurité doivent évaluer chaque déploiement d'agent par rapport à ces critères et mettre en œuvre des contrôles proportionnels au profil de risque créé par la combinaison présente.

Comment mettre en place des garde-fous de sécurité pour les agents IA ?

Mettez en place des mesures de sécurité à plusieurs niveaux couvrant chaque étape du fonctionnement des agents. Au niveau de l'entrée, déployez prompt injection et un filtrage de contenu pour détecter et supprimer les instructions malveillantes. Au niveau de l'exécution, mettez en place des listes d'outils autorisés, des contraintes de portée et une limitation de débit afin d'empêcher toute action non autorisée ou excessive. Au niveau de la couche de sortie, utilisez la détection des informations personnelles identifiables (PII), le masquage des données sensibles et la validation des réponses. Déployez des outils d'observabilité avant d'étendre l'autonomie, maintenez l'approbation humaine pour les actions irréversibles et intégrez la surveillance des agents aux workflows SOC existants. Commencez par des déploiements à faible niveau d'autonomie et ne progressez qu'après avoir démontré la maturité de la sécurité.

Qu'est-ce qu'une identité non humaine dans l'IA agentique ?

Les identités non humaines (NHI) sont les identités numériques attribuées aux agents IA, aux comptes de service, aux bots et aux processus automatisés plutôt qu'aux utilisateurs humains. Avec un ratio NHI/humain de 50:1 dans les entreprises aujourd'hui, les agents IA représentent une catégorie de NHI en pleine croissance qui nécessite une gouvernance de sécurité dédiée. Une gouvernance efficace nécessite de traiter les agents IA comme des identités de premier ordre avec une gestion indépendante du cycle de vie, un accès avec le moins de privilèges possible, une autorisation juste à temps et une surveillance continue du comportement, plutôt que de simplement hériter des autorisations des utilisateurs ou de maintenir des privilèges permanents.

Quels cadres de conformité s'appliquent à l'IA agentique ?

Les principaux cadres comprennent le Top 10 OWASP pour les applications agentiques 2026 (publié en décembre 2025), MITRE ATLAS avec 14 nouvelles techniques axées sur les agents ajoutées en octobre 2025, le projet de profil cyber-IA du NIST publié en décembre 2025 et la norme ISO/IEC 42001:2023, première norme de certification des systèmes de gestion de l'IA. Les exigences réglementaires comprennent la loi européenne sur l'IA pour la classification des IA à haut risque, la loi californienne SB 53 qui entrera en vigueur en janvier 2026 et qui impose des cadres de gestion des risques aux grands développeurs d'IA, et la loi texane TRAIGA qui interdit les résultats d'IA nuisibles. Les organisations doivent aligner leurs contrôles de sécurité des IA agences sur ces cadres dans le cadre de leur programme global de conformité.