Article coécrit par ZackAbzug, Fabien Guillot et Alex Groyz.
---
Le 3 juin 2026, Anthropic a publié le « LLM ATT&CK Navigator », un rapport couvrant une année d’activité réelle d’attaquants provenant de 832 comptes qu’elle a bannis pour utilisation malveillante, mis en correspondance avec MITRE ATT&CK. Il s’agit du compte rendu public le plus clair à ce jour sur ce que les attaquants demandent réellement à un modèle d’IA de faire. Nous l’avons lu attentivement, avons comparé nos notes, et deux éléments importants pour la détection ont retenu notre attention.
- Tout d'abord, l'utilisation de l'IA par les attaquants reste concentrée là où vous ne pouvez pas la voir : sur leurs propres machines, où ils développent les malware les outils qui leur permettent de contourner vos défenses.
- Deuxièmement, lorsque l'IA est utilisée pour faciliter les actions menées après une intrusion, il s'agit des mêmes actions que celles menées par des pirates informatiques classiques, et des mêmes actions que celles que les systèmes de détection des menaces réseau et d'identité sont conçus pour repérer.
La suite de cet article présente trois enseignements tirés de ces données, ainsi que l'efficacité de la détection une fois qu'une attaque a atteint votre environnement.
Point à retenir n° 1 : l'IA sert principalement à se faire admettre, et ça marche
L'utilisation la plus courante de l'IA dans l'ensemble de données concernait le développement de capacités, principalement la création malware: 69 % des acteurs étudiés. Venaient ensuite, de très près, l'obfuscation de code (64,7 %), l'extraction de données à partir des propres systèmes de l'attaquant (55,9 %) et la neutralisation des défenses (54,9 %). Le contournement des défenses était la tactique la plus répandue, utilisée par 84,4 % des acteurs.
Mettez tout cela bout à bout et le tableau se dessine. La plupart des IA d’attaquants utilisées aujourd’hui visent un seul objectif : créer malware contourner endpoint et malware s’infiltrer dans un environnement. Il s’agit d’une phase de préparation qui se déroule sur une infrastructure qui ne vous appartient pas. Elle ne traverse pas votre réseau, n’affecte pas votre fournisseur d’identité et n’apparaît pas dans vos journaux. Vous ne pouvez pas détecter un modèle en train d’écrire une charge utile sur une machine que vous ne contrôlez pas, et vous n’en avez d’ailleurs pas besoin.
Mais il y a une conséquence dont vous devez tenir compte. Si l’IA permet aux attaquants de développer plus efficacement et plus rapidement des techniques capables de contourner l’EDR, ils seront plus nombreux à parvenir à s’infiltrer. L’approche réaliste consiste à partir du principe que le système a été compromis. La question n’est plus de savoir si une menace parviendra à passer, mais ce que vous serez en mesure de détecter une fois que ce sera le cas. C’est le cas d’une couche de détection qui fonctionne au sein même de l’environnement, après l’accès initial, en se basant sur le comportement plutôt que sur des signatures.
Point à retenir n° 2 : l'IA s'implante de plus en plus en aval de la chaîne de destruction
Ces premières données constituent un instantané, et non une conclusion définitive. En comparant le premier semestre au second, le rapport montre que les pirates ont davantage recours à l’IA à un stade plus avancé de l’opération, c’est-à-dire lors des activités pratiques menées une fois qu’ils ont pénétré dans le système. La découverte de comptes et l’exfiltration automatisée ont toutes deux augmenté au cours du second semestre.
C’est cet aspect qui importe pour un SOC, car ce sont les techniques rares qui sont les plus dangereuses. L’utilisation de l’IA pour les mouvements latéraux constituait le marqueur le plus significatif d’un acteur à haut risque : les 54 acteurs qui y avaient recours présentaient un score de risque moyen de 56,4, soit près de dix points au-dessus de la moyenne de 46,8. Au niveau des techniques, les acteurs les plus risqués s’appuyaient sur des services à distance tels que SSH et SMB, des comptes valides, le « dumping » d’identifiants et la mise en place de données intermédiaires pour exfiltrer des informations. Chacune de ces techniques était trois à cinq fois plus fréquente chez eux que chez les autres.
Un cas permet d’illustrer cela. Anthropic décrit GTG-1002, l’opérateur à l’origine d’une campagne d’espionnage pilotée par l’IA qu’elle a déjouée en novembre 2025 et qui visait des cibles gouvernementales et des infrastructures critiques. La liste des techniques utilisées n’avait rien d’exceptionnel. Ce qui le distinguait, c'était son mode de fonctionnement : l'opérateur exécutait Claude Code sur une machine sous Kali Linux, connectait des outils de tests d'intrusion en tant que serveurs MCP, puis laissait le modèle analyser le système, exploiter une faille pour accéder au réseau interne, récolter des identifiants et se déplacer latéralement, tandis qu'un humain se contentait de définir la direction à suivre. La reconnaissance et le cheminement vers l'implantation étaient pilotés par l'IA dès le début.
Reconnaissance d'Active Directory, découverte de comptes, déplacement latéral, exfiltration : voilà le domaine dans lequel la détection réseau excelle. Alors que de plus en plus d'acteurs intègrent l'IA à ces dernières étapes — et la tendance va clairement dans ce sens —, la détection réseau et la détection des identités gagnent en importance, et non l'inverse.
Le fil conducteur : l'identité
Un thème commun relie ces deux volets : l’identité. Les flux de travail Cloud l’IA passent par les utilisateurs, les entités de service et les identités gérées. Les données d’Anthropic montrent que les comptes valides constituent l’une des techniques les plus souvent associées aux acteurs à haut risque, et qu’un agent agissant au sein de votre environnement doit tout de même s’authentifier, accéder aux services et se comporter comme un compte.
C'est important, car cela ne dépend pas de la surface d'un produit en particulier. Que l'attaquant soit un être humain ou un agent, que la charge de travail concerne une cloud ou un service d'IA, le signe révélateur est le même : une identité utilisée depuis un emplacement inapproprié, accédant à un élément avec lequel elle n'a aucun antécédent, et se comportant de manière inhabituelle. C'est dans la détection des identités et des comportements suspects que tout cela converge.
Où s'étend la couverture
Comme Anthropic a mis en correspondance ses conclusions avec les identifiants de techniques MITRE, et que Vectra associe à chaque détection les mêmes identifiants, les deux sources concordent. En ce qui concerne les techniques post-intrusion qui permettent d’identifier les acteurs malveillants, la couverture est très complète. Vous n’avez pas accès aux premières étapes, largement basées sur l’IA, mais dès qu’une opération utilisant l’IA commence à se dérouler au sein de votre réseau, elle génère un comportement que Vectra est conçu pour détecter.
Une technique nécessite une note de bas de page. Le déploiement d’un shell Web (T1505.003) ne dispose pas d’une détection Vectra dédiée : l’installation s’effectue souvent endpoint, bien que le canal de commande et de contrôle qu’il crée apparaisse dans les catégories « Tunnel HTTPS caché » ou « Accès distant externe ». Les attaques par réplication de domaine DCSync et DCShadow apparaissent dans la catégorie « Opérations Active Directory suspectes », que Vectra associe à T1207 et à la tactique « Accès aux identifiants ».
GTG-1002 correspond à ce profil. Les services SSH à distance, l'exploitation de services à distance, la collecte d'identifiants et la technique « archive-and-stage » sont autant de comportements que ces détections sont conçues pour mettre en évidence, que l'opérateur soit une personne ou un modèle agissant via un serveur MCP.
Point à retenir n° 3 : le modèle qui sous-tend l'attaque va devenir plus difficile à détecter
Il y a lieu de s’attendre à ce que cette « zone d’ombre » initiale s’élargisse. Des fournisseurs comme Anthropic investissent massivement dans des mesures de sécurité, de surveillance et de détection afin d’empêcher que leurs modèles ne soient utilisés à des fins malveillantes, et ils s’améliorent de plus en plus dans ce domaine. La réaction probable sera que certains acteurs se tournent vers des modèles open source qu’ils peuvent exploiter eux-mêmes, sans barrières de sécurité et sans surveillance de la part d’un fournisseur. Des rapports comme celui de Navigator existent parce qu’Anthropic peut observer ses propres systèmes. Les modèles auto-hébergés n’offrent pas cette visibilité, et on dispose aujourd’hui de peu d’informations sur cette évolution.
C’est là l’argument le plus convaincant en faveur d’une détection axée sur le comportement plutôt que sur l’outil. Un rapport basé sur les données d’un fournisseur ne saurait constituer votre stratégie de détection, car l’opérateur suivant pourrait ne pas faire appel à ce fournisseur. Ce qui ne change pas, en revanche, c’est ce que l’attaquant doit faire au sein de votre environnement. Un compte qui se connecte depuis un emplacement inhabituel et accède à un service qu’il n’a jamais utilisé présente les mêmes caractéristiques, qu’il soit piloté par un humain, un modèle Frontier ou un modèle auto-hébergé. Anthropic reconnaît ouvertement qu’ATT&CK ne rend pas encore compte de ce qui a rendu GTG-1002 exceptionnel, à savoir l’orchestration autonome qui a enchaîné les techniques à la vitesse d’une machine, et indique être en discussion avec MITRE pour ajouter des catégories dédiées aux comportements agentiques. Tant que ce vocabulaire n’existe pas, la détection qui tient la route est celle qui n’a jamais dépendu de la désignation de l’outil.
Ce qui ne change pas
Les attaquants utilisent l’IA pour s’introduire plus rapidement et, de plus en plus, pour effectuer le travail concret une fois à l’intérieur. Cela implique deux choses à la fois : vous ne verrez pas ce qui se passe sur les machines de l’attaquant, et vous n’en avez pas besoin. En revanche, vous pouvez observer ce qui se passe sur vos propres machines, à condition de surveiller les comportements au niveau du réseau et des identités plutôt que de vous concentrer sur l’outil qui en est à l’origine. Partez du principe que le système a été compromis, surveillez les comportements : l’IA utilisée par les attaquants modifie la vitesse à laquelle le problème se pose, mais pas la nature de la solution.
