Attaque Rowhammer sur les GPU NVIDIA avec GDDR6 : quel impact sur la sécurité de vos ordinateurs ?

  • De nouvelles variantes de Rowhammer permettent aux attaquants de cibler la mémoire GDDR6 des GPU NVIDIA et de prendre le contrôle du système.
  • Des projets de recherche tels que GDDRHammer, GeForge et GPUBreach permettent un accès en lecture/écriture à la RAM du processeur.
  • Il a été démontré que les modèles équipés de GDDR6, tels que les GeForce RTX 3060, RTX 6000 et RTX A6000, étaient vulnérables.
  • Mesures d'atténuation recommandées : activer IOMMU et ECC, au détriment des performances et de la mémoire disponible.

Sécurité sur les GPU NVIDIA avec mémoire GDDR6

Un visage familier du monde de la cybersécurité est revenu sur le devant de la scène, mais cette fois-ci par le biais des cartes graphiques. La vulnérabilité Rowhammer, jusqu'à présent principalement associé à la RAM du processeurIl s'est également avéré efficace contre la mémoire GDDR6 utilisée dans divers GPU NVIDIA, ouvrant la voie à des attaques pouvant aboutir à un contrôle total du système.

Plusieurs équipes universitaires ont présenté leurs travaux presque simultanément. Chaînes d'attaques complètes contre les GPU NVIDIA avec GDDR6Avec des noms comme GDDRHammer, GeForge ou GPUBreach. Au-delà des aspects techniques, le message est clair pour les utilisateurs, les entreprises et les environnements cloud en Europe : certaines cartes graphiques, largement utilisées dans les PC personnels, les stations de travail et les serveurs, peuvent permettre à un attaquant d’obtenir des privilèges d’administrateur sur le système d’exploitation.

Qu'est-ce que Rowhammer et pourquoi cible-t-il maintenant les GPU équipés de GDDR6 ?

Rowhammer est une vulnérabilité physique qui exploite la manière dont les cellules de mémoire DRAM sont fabriquées et chargéesSi certaines lignes de mémoire sont accédées très rapidement et de manière répétée (« martelage »), des perturbations électriques sont générées qui peuvent provoquer des changements de bits dans les lignes adjacentes, les basculements de bits bien connus : un 0 devient un 1 ou vice versa sans que le logiciel l'ait ordonné.

Les premiers travaux universitaires, à l'époque de Mémoire DDR3 et DDR4 ultérieureIls ont démontré que cette technique pouvait être utilisée pour contourner l'isolation des processus, manipuler des données sensibles et élever les privilèges d'un utilisateur non autorisé à ceux d'un administrateur système. Pendant des années, on a cru que les mesures d'atténuation mises en œuvre et les progrès matériels avaient permis de contenir le problème, mais en réalité, la surface d'attaque s'est étendue.

Des recherches récentes montrent que La mémoire GDDR6 des GPU modernes n'est pas sûreAu lieu d'attaquer la RAM principale liée au processeur, les équipes ont concentré leurs efforts sur la mémoire dédiée de la carte graphique, exploitant des schémas d'accès très agressifs et des techniques spécifiques pour contourner les protections de rafraîchissement de ligne interne (TRR) présentes dans ces puces.

La nouveauté ici ne réside pas seulement dans le fait que Rowhammer fonctionne sur GDDR6, mais aussi dans le fait que Les attaquants peuvent passer de la corruption de la mémoire du GPU à la manipulation directe de la mémoire du processeur hôte., en utilisant la logique de gestion de la mémoire propre à la carte et les fonctionnalités du bus PCIe.

Recherche GDDRHammer et GeForge : du basculement de bits à la prise de contrôle du système

Deux groupes de recherche, travaillant indépendamment dans des universités américaines, ont publié des études sous les noms de GDDRHammer et GeForce ForgeLes deux partagent une idée de base : provoquer des inversions de bits dans la mémoire GDDR6 du GPU et transformer ces altérations physiques en un compromis total du système.

Dans leurs tests, les chercheurs ont analysé au moins 25 modèles de GPU NVIDIA avec GDDR6Cela concerne les cartes graphiques grand public et professionnelles basées sur les architectures Ampere et Ada Lovelace. Parmi les cartes où des inversions de bits et des exploitations réussies ont été observées figurent la GeForce RTX 3060, ainsi que les séries professionnelles RTX 6000 et RTX A6000.

Les résultats sont frappants : la méthode GeForge a permis d’induire plus de Modifications de 1 100 bits sur une RTX 3060 Pour les consommateurs, ce chiffre atteint un peu plus de 200 sur une carte graphique professionnelle RTX A6000. De son côté, GDDRHammer a réalisé des moyennes supérieures à mille basculements de bits par gigaoctet de mémoire, un chiffre bien supérieur aux tentatives précédentes sur du matériel graphique.

Pour y parvenir, les équipes ont dû contournement des mesures d'atténuation TRR Intégrées aux puces mémoire GDDR6, ces puces utilisent des modèles d'accès non uniformes sur plusieurs lignes, avec des variations de fréquence, d'ordre et d'intensité, afin que le matériel ne détecte pas le comportement comme suspect tout en générant suffisamment de perturbations pour forcer des modifications de bits.

Une fois la capacité à déclencher des basculements de bits de manière fiable démontrée, l'étape suivante était diriger ces changements vers des structures de mémoire particulièrement sensiblesDans ce cas, les tables de pages gérées par l'unité de mémoire du GPU.

Comment les tables de pages du GPU sont manipulées pour accéder à la RAM du CPU

Le cœur de ces attaques réside dans le tables de pages hiérarchiques que le GPU utilise pour traduire les adresses virtuelles à des adresses physiques, à la fois dans sa mémoire locale et dans la mémoire du système hôte. Généralement, ces structures sont allouées dans des régions mémoire difficiles à prévoir ou difficiles d'accès pour un code non privilégié.

Les exploits GDDRHammer et GeForge utilisent des appels mémoire standard (tels que ceux basés sur cudaMalloc et la mémoire virtuelle unifiée) pour effectuer une véritable opération. « massage de mémoire »Les blocs sont alloués et libérés de manière très contrôlée jusqu'à ce que certaines tables de pages se retrouvent dans des positions physiques que l'attaquant sait vulnérables à Rowhammer.

Une fois ces régions localisées, l'objectif est corrompre une entrée spécifique dans la table des pages par une inversion de bit. En modifiant un bit spécifique du pointeur d'adresse physique, l'entrée cesse de pointer vers la table légitime et commence à pointer vers une table falsifiée construite par l'attaquant dans une mémoire contrôlée.

À partir de ce moment, le GPU croit utiliser une table de pages valide, mais en réalité toutes les opérations de lecture et d'écriture Par ce biais, les données sont redirigées vers des emplacements mémoire choisis par le code malveillant. Le point crucial est que ces adresses ne résident plus dans la mémoire du GPU, mais dans la RAM physique du système hôte.

Lors de démonstrations pratiques, les chercheurs ont obtenu les résultats suivants avec cette méthode. Accès arbitraire en lecture et en écriture sur toute la mémoire du processeurDans un scénario présenté, l'exploit a écrasé une partie du code d'une bibliothèque système (par exemple, les fonctions libc) directement dans la RAM de l'hôte, de sorte que lorsqu'un programme légitime avec des privilèges élevés était exécuté, le code injecté était lancé et une console de superutilisateur était obtenue.

GPUBreach : la troisième méthode combinant les vulnérabilités de Rowhammer et des pilotes

Outre GDDRHammer et GeForge, les chercheurs ont décrit un troisième vecteur appelé GPUBreachIl s'agit désormais de la troisième attaque Rowhammer confirmée contre les GPU. Dans ce cas précis, l'attaque ne se limite pas à la physique de la mémoire, mais repose également sur… vulnérabilités récentes dans les pilotes NVIDIA.

GPUBreach prouve que c'est possible compromettre le noyau du système d'exploitation même lorsque l'IOMMU est actifCeci est particulièrement préoccupant pour les serveurs et les stations de travail qui avaient déjà adopté cette mesure comme principal système de protection. L'étude s'est concentrée principalement sur la NVIDIA RTX A6000, un GPU haut de gamme largement utilisé dans les centres de données, les environnements de calcul intensif et les projets d'intelligence artificielle.

Dans ce scénario, l'attaque commence toujours par tables de pages GPU corrompues à l'aide de RowhammerMais elle combine ensuite cette capacité avec l'exploitation des failles de sécurité des pilotes pour étendre encore davantage ses privilèges. De cette manière, le GPU cesse d'être un simple accélérateur de calcul et devient le tremplin permettant de prendre le contrôle du système hôte.

La combinaison de la vulnérabilité physique (Rowhammer) et erreurs logiques dans le logiciel du contrôleur Cela place GPUBreach dans une position particulièrement délicate, car cela limite l'efficacité des barrières qui étaient auparavant considérées comme raisonnablement robustes dans les environnements professionnels.

Modèles concernés et état de la vulnérabilité sur NVIDIA

Les études publiées à ce jour ne dressent pas une liste exhaustive de tous les modèles concernés, mais elles ont confirmé plusieurs exemples précis. Parmi eux : les GPU grand public GeForce RTX 3060 et les GPU professionnels RTX 6000 et RTX A6000, tous dotés de mémoire GDDR6 et basés sur l'architecture Ampere.

Lors de tests plus vastes, l'un des groupes de recherche a vérifié 25 cartes graphiques haut de gamme avec GDDR6L'étude a révélé que 16 des 17 modèles RTX A6000 testés étaient vulnérables aux attaques Rowhammer proposées. Des tests ont également été menés sur des modèles de la famille Ada, révélant des vulnérabilités similaires, bien que des tests sur une gamme de produits plus étendue soient en cours.

En revanche, les recherches suggèrent que Les mémoires GDDR6X et GDDR7 ne sont pas affectées par les mêmes méthodes.Du moins avec les techniques actuelles. Il en va de même pour les mémoires comme HBM2 ou HBM3 qui intègrent des mécanismes de correction d'erreurs sur puce (ECC sur puce), où les mêmes schémas de défaillance n'ont pas été observés.

Les communications publiques de NVIDIA ont été prudentes. L'entreprise a fait référence à documentation de sécurité publiée précédemment Cela fait suite à des attaques Rowhammer précédentes ciblant les GPU, telles que GPUHammer, et invite les clients concernés à consulter les guides de prévention. Aucune mise à jour spécifique du firmware ou des pilotes n'a été détaillée à ce jour pour bloquer complètement ces nouvelles failles de sécurité.

Il convient de souligner, en tout cas, que Aucun incident réel actif n'est connu. qui exploitent ces méthodes contre les GPU NVIDIA équipés de GDDR6. Il s'agit pour l'instant de preuves de concept académiques, mais leur impact potentiel est suffisamment sérieux pour que les fabricants, les fournisseurs de cloud et les grandes organisations s'y intéressent déjà.

Les limites des antivirus et les raisons pour lesquelles l'attaque est si difficile à détecter

L'une des conclusions les plus inquiétantes de ces études est que, à mesure que les privilèges augmentent au niveau matérielLes solutions de sécurité traditionnelles offrent une visibilité très limitée. Les programmes antivirus et de nombreux outils de surveillance fonctionnent principalement au niveau du système d'exploitation, mais le problème ici trouve son origine plus tôt, dans l'interaction du GPU avec la mémoire.

Lorsque la carte graphique obtient un accès direct en lecture et en écriture à la mémoire physique de l'hôte, les opérations sont acheminées. via le bus PCIe, en contournant certaines commandes du processeurDu point de vue du système, bon nombre de ces actions sont prises pour du trafic informatique accéléré légitime, de sorte qu'aucune alarme claire n'est déclenchée.

De plus, les motifs de martelage ont été conçus pour passer inaperçu grâce aux protections des puces mémoireCela rend difficile pour les logiciels de sécurité de faire la distinction entre un accès intensif normal (par exemple, depuis une application d'IA ou de rendu) et une tentative d'attaque.

Tout cela rend le mesures purement logicielles Les logiciels antivirus, les solutions EDR et autres mesures de sécurité ne suffisent pas toujours à stopper ce type d'attaques. Les défenses les plus efficaces reposent sur des modifications de la configuration matérielle et, à moyen terme, sur des ajustements de la conception des GPU, de la mémoire et des contrôleurs.

Mesures d'atténuation : IOMMU, ECC et ajustements de configuration

Les différentes équipes de recherche s'accordent sur deux lignes de défense immédiates majeures pour les systèmes utilisant des GPU NVIDIA avec mémoire GDDR6 : Activez l'IOMMU dans le BIOS et activez le mémoire à correction d'erreurs (ECC) sur les cartes qui le permettent.

L'unité de gestion de la mémoire d'entrée/sortie (IOMMU) alloue adresses virtuelles visibles par les appareils (comme le GPU) à des adresses physiques spécifiques dans la mémoire de l'hôte. Cela permet de limiter les portions de RAM auxquelles la carte peut accéder directement, réduisant ainsi la portée d'une éventuelle exploitation de faille.

En théorie, l'activation de l'IOMMU devrait empêcher une simulation d'accès mémoire par GPU de cibler librement toute la mémoire du processeur. Cependant, des recherches indiquent que Elle n'est pas toujours activée par défaut. Dans de nombreuses distributions et systèmes Linux commerciaux, que ce soit pour des raisons de compatibilité ou de performance, cela laisse un nombre considérable d'ordinateurs exposés.

La seconde défense majeure est l'activation de la correction d'erreurs ECC sur le GPU. Cette fonctionnalité permet… La mémoire corrige automatiquement de nombreuses erreurs sur un seul bit.Cela signifie qu'une grande partie des inversions de bits provoquées par Rowhammer sont neutralisées avant de pouvoir être exploitées. Le problème est que la correction d'erreurs (ECC) a un coût : elle réduit la mémoire utilisable et peut entraîner une perte de performance notable, ce qui incite de nombreux utilisateurs professionnels à la désactiver.

Pour ne rien arranger, certaines études suggèrent que Toutes les attaques Rowhammer ne sont pas bloquées par ECC.Certains schémas peuvent provoquer des erreurs multi-bits dépassant la capacité de correction, ou introduire des erreurs non détectées comme corrigibles ; par conséquent, bien que la correction d'erreurs (ECC) rehausse considérablement le niveau de performance, elle ne constitue pas une solution parfaite.

Impact en Europe : PC personnels, stations de travail et cloud

Dans le contexte européen, l'ampleur de ces vulnérabilités est particulièrement pertinente pour trois grands groupes d'utilisateurs: les particuliers possédant des PC de jeu ou de création de contenu, les entreprises disposant de stations de travail graphiques et les fournisseurs de services cloud qui partagent des GPU entre plusieurs clients.

Sur le marché domestique, de nombreux systèmes de milieu et de haut de gamme incluent cartes graphiques comme la GeForce RTX 3060Il s'agit d'un des modèles spécifiques où des inversions de bits fonctionnelles et des chaînes d'attaque ont été observées en laboratoire. Cependant, le risque pratique est actuellement considéré comme faible : les exploits sont complexes, nécessitent une connaissance approfondie du système et aucune campagne active les utilisant à grande échelle n'a été observée.

C'est là que la situation devient plus grave que environnements d'entreprise et centres de donnéesLes GPU professionnels RTX 6000 et RTX A6000, conçus pour le calcul scientifique, l'IA, la conception avancée ou la virtualisation graphique, sont courants dans les organisations européennes de secteurs tels que l'ingénierie, l'automobile, la banque ou la recherche publique.

Dans les scénarios de cloud partagé, un seul GPU peut servir plusieurs clients simultanémentSi l'un d'eux parvenait à exécuter avec succès une attaque Rowhammer depuis son conteneur ou sa machine virtuelle, il pourrait forcer une élévation de privilèges affectant l'hyperviseur ou d'autres locataires sur le même serveur, avec un impact potentiel sur la confidentialité et la disponibilité des données.

Les grands fournisseurs de services cloud en Europe appliquent généralement des politiques de sécurité plus strictes que pour un PC personnel : configuration IOMMU optimisée, segmentation des ressources, surveillance plus poussée et, dans de nombreux cas, Activation ECC par défaut dans leurs GPU. Néanmoins, cette recherche nous rappelle que même les accélérateurs graphiques haut de gamme ne sont pas sans risque.

Que peuvent faire les utilisateurs et les organisations dès maintenant ?

Pour ceux qui utilisent quotidiennement des cartes graphiques NVIDIA avec GDDR6, que ce soit en Espagne ou ailleurs en Europe, il existe un certain nombre de mesures raisonnables à prendre sans paniquer. La première est : Vérifiez les paramètres du BIOS et le système d'exploitation pour vérifier si l'IOMMU est activé et fonctionne correctement.

Dans les environnements professionnels et sur les serveurs, notamment lors de l'utilisation de stations de travail avec RTX 6000 ou RTX A6000Il est judicieux d'envisager sérieusement l'activation de la correction d'erreurs (ECC), même au prix d'une légère perte de performances et de mémoire disponible. Dans de nombreux cas, la réduction des risques compense largement cet impact, notamment lors du traitement de données sensibles ou de charges de travail critiques.

Il est également conseillé Maintenez les pilotes et le firmware à jour. des cartes graphiques, et surveillez de près les avis de sécurité publiés par NVIDIA et le mises à jour critiques dans ChromeBien qu'il n'existe actuellement aucun correctif miracle qui élimine complètement la menace, des mises à jour devraient apparaître pour atténuer certains vecteurs (par exemple, en corrigeant les failles des pilotes exploitées par GPUBreach).

Pour les utilisateurs à domicile possédant une RTX 3060 ou d'autres modèles Ampere avec GDDR6, le conseil le plus pratique est de Ne désactivez pas les mesures de sécurité pour des raisons de performance. Sauf raison valable, évitez d'installer des logiciels d'origine douteuse susceptibles d'exécuter du code sur le GPU et, de manière générale, considérez la carte graphique comme un composant aussi sensible que le processeur lui-même.

Dans le cas des administrateurs système et des responsables de la sécurité, ces enquêtes se justifient Examiner les politiques de segmentation des ressources GPU Dans les environnements virtualisés, renforcez l'isolation entre les locataires et, si possible, limitez l'accès direct aux API GPU de bas niveau aux processus véritablement nécessaires.

Tout indique une relation entre mémoire, matériel graphique et cybersécurité Cet écart continuera de se réduire dans les années à venir. Rowhammer, loin d'être une simple curiosité académique du passé, s'est pleinement intégré au monde des GPU modernes et a démontré sa capacité à franchir la frontière entre la mémoire graphique et la mémoire du système hôte.

Les tests GDDRHammer, GeForge et GPUBreach montrent que Il est possible de passer d'une simple inversion de bits dans la GDDR6 à un shell avec des privilèges root dans le système d'exploitation.Cette attaque peut même contourner certaines défenses actuelles. Bien que la menace demeure pour l'instant théorique et confinée au laboratoire, le message est clair pour les utilisateurs, les entreprises et les fournisseurs de services cloud en Europe : il est conseillé d'adapter les configurations, d'activer les mesures de protection disponibles et de suivre de près la réaction du secteur et des fabricants face à cette nouvelle génération d'attaques Rowhammer ciblant les GPU.

Android désactive le WebGPU dans Chrome avec la protection avancée
Article connexe:
Android désactive le WebGPU dans Chrome avec la protection avancée

Suivez-nous sur Google Actualités