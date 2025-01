Elle est là, la nouvelle génération Blackwell tant attendue de NVIDIA, avec pour fer de lance la RTX 5090. Mais répond-elle vraiment à toutes les attentes ? Réponse dans notre test.

Après une génération 40 dédiée particulièrement à la baisse de consommation, il était temps pour NVIDIA de frapper à nouveau un grand coup avec sa nouvelle série 50. Basée sur Blackwell, l’architecture phare des calculs d’intelligence artificielle modernes, elle était attendue au tournant pour prouver une bonne fois pour toute que NVIDIA n’avait pas abandonné le jeu vidéo au profit de ce nouveau marché B2B juteux. Cette nouvelle série signe également l’avènement du DLSS 4, une suite de technologies qui ne cesse de faire parler sur internet… mais qu’en est-il réellement ?

La RTX 5090, carte graphique qui ne fait aucun sacrifice autre que celui de votre portemonnaie, est encore la meilleure représente du savoir-faire de NVIDIA dans toutes ces matières. Il est donc temps de la faire tourner à fond, pour en extraire tout le potentiel. C’est le but de notre test.

Prix et disponibilité

La RTX 5090 Founder’s Edition que nous testons ici sera disponible en France à partir du 30 janvier 2025, au prix conseillé de 2349 euros. Notez que les constructeurs comme ASUS ou MSI proposeront également cette variante de leurs côtés, pour des performances similaires mais des designs différents.

NVIDIA GeForce RTX 5090 GPU Blackwell Gravure 4 nm Coeurs CUDA 21760 RT FLOPS 318 tflops Tensors TOP 3352 AI TOPS Mémoire GDDR 32 Go GDDR7 Bus mémoire 512 Bits

Il s’agit ici d’une large augmentation de tarif par rapport à la 4090 de la génération précédente, qui était vendue 1949 euros à sa sortie. Tarif substantiel pour carte graphique sans concession : les 90 ne sont pas faites pour le commun des mortels, mais bien pour les plus fortunés qui regardent moins leur compte en banque que leurs compteurs de FPS. Et en l’absence de la moindre concurrence sur ce segment, NVIDIA fait bien ce qu’il veut avec le prix tant qu’il se trouve des acheteurs pour le payer.

Voici notre configuration de test pour la RTX 5090 :

CM : ROG Strix X870-I Gaming WiFi

CPU : AMD Ryzen 9 9800x3D

Refroidissement : Corsair iCue H100i RGB Elite

RAM : 2×16 Go Corsair Vengeance DDR5-6000 MHz

SSD : MSI Spatium M580 PCIe 5.0 2 To

Alimentation : Corsair SF1000L 80 Plus Gold

A lire aussi – Test Nvidia GeForce RTX 4090 : c’est un véritable monstre !

Design, consommation et chauffe

Le plus grand changement cette année est que comparativement à la génération précédente, la RTX 5090 passe d’un design réclamant 3 voire 4 slots à un design à 2 slots. Oui, toute cette puissance est désormais contenue dans un corps capable de tenir dans une configuration dite SFF, pour “Small Form Factor”. C’est tout simplement impressionnant d'ingénierie. En parlant d’ingénierie, le design thermique a également été totalement revue pour un flux d’air traversant et deux ventilateurs placés sur le bas de l’appareil. Retour aux traditions pour NVIDIA sur ce point.

Voilà qui fait son affaire, puisque dans nos tests, la RTX 5090 Founder’s Edition ne reste qu’à 36°C au repos, et monte au maximum à 74°C en pleine charge. Attention cependant : la nouvelle mémoire ultra rapide GDDR7 a tendance à chauffer bien plus que la génération précédente, et monte rapidement à 88°C. Rien d’inquiétant sur le papier, mais il s’agit d’un trait notable de cette nouvelle génération.

Ce qui importe le plus est finalement sa consommation. À 575W annoncé, la RTX 5090 consomme 125W de plus (+28%) que la RTX 4090 en son temps. Alimentation de 1000W minimum recommandée et port d’alimentation 16 pin obligatoire, bien qu’un adaptateur soit fourni. Il faut dire que la puce Blackwell multiplie le nombre de cœurs CUDA, de 16 384 à 21 760 (+33%), et tous ces nouveaux petits cœurs doivent bien être alimentés. Ne vous y trompez pas : le rapport entre les deux n’est pas aussi simple à tracer, mais nous y reviendrons plus tard.

Notons qu’en jeu, là où la 40 savait se contenir, la RTX 5090 tire bien entre 480 et 550W sur les expériences les plus gourmandes. En revanche, elle sait rester tranquille au repos à 22W. Si l’on aurait adoré voir NVIDIA continuer sur le chemin de l’efficience, cette génération 50 revient à “la norme d’avant” pour ainsi dire, avec des cartes qui n’hésitent pas à consommer pour envoyer leur puissance. Cette 5090 Founder’s Edition a tendance à émettre un coil whine dérangeant, particulièrement alors que celui-ci s’avère aigu, lorsqu’elle est amenée à balancer plus de 100 frames par secondes.

Un point sur lequel NVIDIA se veut rassurant : il semble que le problème ne concerne que quelques exemplaires presse, et celui-ci sera couvert par la garantie à la sortie en cas de coup dur. Il est également possible que le souci du coil whine soit réglé par le biais d’une mise à jour ; les équipes de NVIDIA travaillent sur la question.

Calculs créatifs et intelligence artificielle

Avant de nous lancer dans les mesures du jeu vidéo et l’explication du DLSS 4, faisons un tour du côté de nos amis les créatifs. La RTX 4090 se destine après tout à des petites entreprises qui pourraient profiter de larges calculs d’intelligence artificielle ou d’une puissance de rendu accrue pour la production audiovisuelle. Il est à noter que la RTX 5090 intègre désormais 3 encodeurs NVENC de dernière génération, compatibles AV1 bien sûr, et s’est focalisée sur les performances en photo et vidéo du 4:2:2 pour des couleurs toujours plus proches du réel.

Sur le terrain de la production photo et vidéo, le premier résultat est… décourageant. Sur la partie photo, testée sur les dernières versions d’Adobe Photoshop et de Lightroom Classic, rien ne change véritablement. Dans un mouchoir de poche, les RTX 5090, 4090 et RX 7900 XTX offrent essentiellement les mêmes performances. C’est sur la partie vidéo que le rapport change du tout au tout, alors que la RTX 5090 offre 18% de performances en plus par rapport à la génération précédente, qui se tenait au coude à coude avec l’offre d’AMD. Et sur DaVinci Resolve, sensiblement le même constat avec une augmentation plus ténue de 9,8% qui est à contraster avec un score bien plus bas pour la RX 7900 XTX.

C’est peut-être sur la production 3D que les évolutions sont encore les meilleures. Ici, le rendu Blender de la scène Monster est 25% plus performant, quand Junkshop affiche une augmentation de 30% et Classroom va à 23% d’augmentation. Les cartes AMD, généralement défavorisées sur ce test, le sont toujours plus en comparaison.

Les calculs de l’intelligence artificielle sont très importants sur cette génération, nous allons y revenir. Mais si nos outils de test n’ont pas été mis à jour à temps pour profiter pleinement de TensorRT, qui offre les meilleurs résultats pour les cartes NVIDIA, les scores WindowsML sont déjà un bon indicateur de l’évolution de la RTX 5090. Lers calculs d’inférence en Float 32 sont en augmentation de 22%, avec un score sensiblement similaire pour les entiers. C’est sur le Float16 que nous enregistrons la plus grande évolution à +36%. En considérant que nous n’utilisons pas encore TensorRT, fait spécifiquement pour ces cartes, les évolutions enregistrées ici sont déjà plus que satisfaisantes.

Mais il faut aussi noter que la RTX 5090 se focalise désormais sur les calculs en FP4, jugés comme la meilleure balance performance/qualité de rendu par NVIDIA. Si nos outils de benchmarks ne nous permettent pas encore de proprement comparer les cartes entre elles, nous pouvons noter qu’une génération d’image sous FLUX.1 développé pour l’occasion aura été faite en seulement 3,945 secondes pour du 1024 pixels sous TensorRT. Impressionnant.

Mesures en 4K et 1440p VS RTX 4090

Commençons d’abord par un benchmark théorique : les tests de 3DMark. Nous avons choisi pour cela Speed Way, un benchmark designé pour utiliser pleinement DirectX 12 Ultimate et ses capacités en ray-tracing, et Steel Nomad, qui se focalise sur les performances en rasterization pure des dernières technologies en date. De quoi faire un comparatif moderne pour des cartes extrêmement puissantes.

Grimpez les marches, elles sont presque équivalentes ! La RTX 5090 enregistre des performances en hausse de 43% par rapport à la RTX 4090 sur le benchmark Speed Way, ce qui tend à prouver la grande évolution des cœurs de ray-tracing sur cette génération. Sous Steel Nomad, on retrouve même une augmentation de 55% des performances, ce qui aurait tendance à tordre le cou des discussions autour de l’attention portée par NVIDIA sur les performances en raster. L’évolution, sur le papier, semble phénoménale.

Pour le tester en jeu, nous avons fait appel à 10 titres :

Ces jeux ont été sélectionnés pour différentes raisons. Certains comme Alan Wake 2, Black Myth Wukong ou Cyberpunk 2077 poussent jusqu’à leur retranchement même les cartes graphiques les plus récentes. D’autres comme Marvel Rivals sont un bon indicateur pour le jeu compétitif moderne. Mais surtout, tous ces titres sont compatibles avec une grande majorité des technologies des deux bords, DLSS et FSR. Notez que pour ces comparaisons, le plus bas dénominateur commun est choisi : si un jeu supporte le DLSS Frame Generation, mais pas le FSR3 Frame Generation, alors les mesures sont faites en DLSS/FSR simple pour une même base de comparaison. Le ray-tracing est toujours poussé à fond, soit en path tracing lorsque disponible ou assimilé.

Alan Wake 2

Le dernier titre de Remedy met toutes les cartes graphiques à genou, et n’a pas fini de le faire. En 4k avec ray-tracing activé, l’augmentation des performances paraît bien petite à 9,9%, ce qui ne change d’ailleurs pas en 1440p. C’est en rasterization pure que l’on voit la plus grande différence, avec des performances en augmentation de 26% en 4K et 21% en 1440p.

Cependant, une fois le DLSS2 en mode performance activé, les différences se creusent et l’on peut voir que les nouveaux tensor core font leur office. +19,5% en 4K avec RT, +22% en 1440p avec RT, mais un différentiel moins évident sur le raster à seulement +4,2% en 1440p et +16% en 4K. Le CPU semble un peu plus soulagé.

Baldur’s Gate 3

Sur Baldur’s Gate 3, nous notons une belle amélioration de 35% des performances en 4K pour 29% en 1440p. Avec le DLSS 2 en mode Performance activé, la carte dépasse même largement les 400 FPS de moyenne en 1440p, quand la RTX 4090 les frôlait de très peu.

Black Myth Wukong

Là où Alan Wake 2 semblait un brin au ralenti, les évolutions sont ici plus flagrantes. +33% en 4K avec ray-tracing, pour +24% en 1440p. En rasterization pure, la relation s’inverse : +24% en 4K, certes, mais seulement 6% de plus en 1440p.

En Frame generation x2 activée, nous constatons sensiblement le même écart.

Cyberpunk 2077

Sur Cyberpunk 2077, la tendance se confirme : +44% de performances en 4K avec RT, +36% en 1440p. En raster traditionnel, nous connaissons tout de même de sublimes évolutions : +54% en 4K et +25% en 1440p.

Les augmentations de performance s’adoucissent en DLSS3 avec Frame gen x1 activé, où les différences tournent aux alentours des 30% selon les définitions.

Flight Simulator 2024

Jeu gourmand en CPU par excellence, Flight Simulator 2024 n’en oublie pas de grignoter gentiment la RTX 5090. Ici, les performances augmentent de 22,6% en 4K et de 34,2% en 1440p sans DLSS en mode performance. Avec le DLSS, c’est 15% de gagné en 4K pour 7,4% en 1440p.

Hogwarts Legacy

Hogwarts Legacy est le jeu le plus étrange de notre sélection. En 4K avec ray-tracing activé, il gagne un sublime 36% de performance en plus qui est plus qu’enthousiasmant. Mais en 1440p, l’évolution chute à seulement 2%. Un comportement que l’on retrouve également en 1440p sans ray-tracing, où les RTX 4090 et 5090 font essentiellement match nul, avec avantage pour la RTX 5090 qui maintient un 1% low plus haut. C’est véritablement sur la 4K que Hogwarts Legacy arrive à tirer le meilleur de la nouvelle génération.

Mais le plus étrange est surtout qu’en activant le DLSS 2 en mode performance… la bataille n’a plus vraiment lieu. Les deux cartes ont essentiellement les mêmes performances. Un comportement qui nous laisse perplexe et nous fait penser que le jeu va devoir être mis à jour profondément pour profiter de cette nouvelle génération en bonne et due forme. A moins que cela ne soit résolu côté driver.

Horizon Forbidden West

+21% en 4K, +14% en 1440p, et +23/26% une fois le DLSS3 activé en mode performance. Une noble évolution de génération à génération, notable mais pas grisante.

Indiana Jones et le Cercle Ancien

Voilà un jeu qui a choisi de n’utiliser que les toutes dernières technologies accessibles, et c’est donc ici que nous en attendions le plus. Pas de déception : +32,9% de performances avec le patch tracing activé en 4K, et même 24,4% en 1440p. Sans Path tracing, nous avons tout de même le droit à une augmentation de 16 à 20% des performances sur les deux définitions.

La Frame Gen étant toujours instable sur ce jeu, nous avons choisi de nous focaliser sur le DLSS 2 en mode performance, qui suit sensiblement les mêmes évolutions observées sans.

Marvel Rivals

Marvel Rivals est peut-être le plus simple à analyser de notre sélection : essentiellement +30% tout du long !

Ratchet and Clank Rift Apart

+25% en ray tracing en 4K, pour +20% en 1440p. Une nouvelle fois, c’est sur la rasterization que l’évolution est un peu moins franche : +15% en 4K pour 13% en 1440p.

Avec le DLSS 3 activé en mode performance, l’écart se creuse. La 4K avec RT gagne 32,8% de performances en plus, pour 31,8% en 1440p. Essentiellement de même sans ray-tracing en 4K et en 1440p, où les évolutions dépassent les 30%.

Nouvelles technologies RTX et DLSS 4

Neural Shaders, la vraie révolution de NVIDIA

Maintenant, il y a ces mesures de performances brutes et sur le DLSS 2 voire 3… et il y a l’avenir représenté par la RTX 5090. La génération 50 aux yeux de NVIDIA n’est pas qu’une nouvelle carte, mais le héraut d’une nouvelle ère du rendu mixte 3D et intelligence artificielle. Comprenez qu’auparavant, l’intelligence artificielle du constructeur s’activait “en post production” : le DLSS 2, par exemple, attendait que l’image en 1080p soit créée avant de s’activer pour “l’augmenter” en 1440p ou 4K par exemple. Le principe du “rendu neuronal” promut par NVIDIA est que l’intelligence artificielle s’activera désormais également dans la “phase de production”.

Par exemple, des technologies comme RTX Neural Texture Compression se chargeront de compresser des textures pour les recréer par calcul d’IA, ce qui libérera grandement la VRAM, quand les RTX Neural Materials profiteront de ce principe pour au contraire améliorer le rendu des textures à multiples couches en calculant par IA des propriétés supplémentaires. De nombreuses autres fonctionnalités dans le même esprit sont rendues disponibles désormais, et feront appel non seulement aux capacités de calcul des cœurs CUDA et des RT Cores… mais aussi des Tensor Core.

A lire aussi – DLSS : tout comprendre sur la technologie de Nvidia qui révolutionne le jeu vidéo

Comprenez donc bien une chose : si NVIDIA réussit son pari, la puissance de la partie IA sera aussi importante que la puissance graphique pure à l’avenir pour le jeu vidéo. Mais attention à un point important : ne pensez pas à IA comme vous pensez aux moteurs de génération d’images qui ont volé leurs données sur internet et augmentent drastiquement la consommation électrique mondiale. Ici, les calculs sont fait localement sur la carte graphique à partir des données que le jeu fournit directement. Ce qui veut aussi dire qu’il n’y a aucune chance que les jeux varient d’un PC à l’autre : tout est basé sur le même asset au bout. Il est juste “augmenté” par intelligence artificielle. Maintenant… Les jeux qui profitent pleinement de ces technologies manquent à l’appel du lancement de la RTX 5090.

Un traitement vraiment amélioré ?

Avant de parler des apports de l’intelligence artificielle, parlons d’abord d’une technologie plus traditionnelle mais non moins excellente : RTX Mega Geometry. De nos jours, les calculs du ray-tracing sont extrêmement coûteux pour des jeux très récents utilisant des systèmes comme Nanite d’Unreal Engine, qui construit ses modèles sur des millions de triangle. Dans le profil actuel, le passage d’un rayon se calcule sur chaque triangle, conduisant à une charge monstrueuse de calcul qui a poussé les développeurs à se concentrer uniquement sur le modèle le plus basse qualité pour le calcul du ray-tracing.

Avec RTX Mega Geometry, NVIDIA a optimisé ce type d’opérations pour les accélérer toujours plus en faisant des calculs par packs de triangles. De quoi améliorer le rendu sur un titre comme Alan Wake 2, premier jeu à intégrer la technologie pour ces feuillages. Un avant/après montre à quel point le résultat s’en retrouve drastiquement changé et bien plus précis.

Mais la véritable nouveauté est à voir du côté du DLSS 4, dont la plus grande avancée partagée avec toutes les cartes RTX est le passage d’un modèle de machine learning CNN. Sans vous engourdir le cerveau à expliquer profondément ces choses, sachez simplement qu’une notion de contexte et de traitement parallèle a été ajouté à l’IA utilisée par NVIDIA pour améliorer l’image, faisant qu’elle a désormais une perception bien plus claire de ce qu’elle est censée afficher/améliorer. Et ce sans coût notable de performances.

Il est plus simple de le voir par l’exemple. Sur Alan Wake 2 une nouvelle fois, les défauts du DLSS version CNN s’affichent parfaitement bien. Le rendu des feuilles balayées ici provoquent une trainée pixellisée qui n’a pas lieu d’être et déforme la texture sous-jacente, ce qui disparaît complètement avec la version Transformer du DLSS. Une petite révolution.

Et enfin, il y a le Multi Frame Generation. Finis les OFA physiquement intégrés aux cartes de la série 40, le modèle est si puissant désormais qu’il n’a plus besoin de leur aide et est même capable de créer jusqu’à 3 frames (au choix) supplémentaires pour le rendu final d’un jeu. Nous avons donc une frame créée “naturellement” qui va servir de contexte à la création de 3 nouvelles frames créées par intelligence artificielle, qui ont la lourde tâche de devoir rester cohérentes dans le contexte et dans le mouvement du jeu. Attention cependant : si cette technologie reste exclusive à la série 50, c’est qu’elle a tout de même besoin d’un élément hardware pour fonctionner correctement intégré à chaque carte : une puce dédiée au Flip Metering, qui vient prendre le contrôle de l’ordre et du rythme d’affichage des frames dans la pipeline de rendu.

Résultat des courses ? Un framerate qui augmente de +198,2% pour une fluidité exemplaire. Mais pour réussir cet exploit, encore faut-il que l’image créée par intelligence artificielle soit à la hauteur d’une image créée par rendu 3D traditionnel. Et c’est ici que nous devons changer de jeu, puisque je n’ai pas été capable de repérer la moindre frame créée par IA sur Alan Wake 2. Ou sur Dragon Age The Veilguard d’ailleurs, malgré une scène de baston particulièrement intensive. C’est du côté de Star Wars Outlaws que j’ai enfin pu voir un reliquat du modèle Transformer appliqué à une trame créée par IA pour le Multi Frame Generation.

En regardant frame par frame, on peut parfois voir les contours de certains objets avancer légèrement plus rapidement que l’objet lui-même, comme une erreur de calcul de mouvement de la part de l’intelligence artificielle. Cette erreur est plus souvent visible autour des personnages en très légers mouvements dans des zones d’éclairage complexes. En jeu… c’est tout simplement imperceptible. Et puisque nous n’en sommes qu’aux débuts même de la technologie Transformer appliquée au DLSS 4, c’est fulgurant. Le multi frame generation fait l’effet d’une magie noire interdite, mais prouve bien l’apport que peut avoir l’IA entremêlée dans le rendu d’un jeu vidéo.

Et la latence dans tout ça ?

Le grand débat autour des soi-disantes “fausses frames” est aussi à voir du côté de la latence induite par l’utilisation d’une telle technologie. Il est vrai que les frames créées par intelligence artificielle échappent à la logique d’un jeu vidéo, celle qui régit son monde et donc les interactions que l’on effectue au sein d’un espace virtuel. Pour simplifier, prenons l’exemple d’un jeu de combat. Tout leur principe repose sur le fait d’appuyer sur la bonne touche au bon moment pour exécuter un combo, une série de coups qui s’annulent les uns les autres pour former une suite complète d’attaques. Pour que la logique d’un Street Fighter puisse déterminer cela, elle se cale à 60 FPS. Dès lors, chaque attaque se réfère à cette logique : si j’appuie sur moyen pied après gros poing à la frame 6 sur 60, alors le combo continue. Si j’appuie trop tôt ou trop tard, le combo échoue.

La plupart des jeux vidéo suivent le même principe, mais leur logique s’adapte aux performances du jeu sur votre machine. Plus vous avez de frames, et plus la logique du jeu saura répondre à vos actions rapidement. C’est pour ça que les jeux compétitifs type Counter Strike, Valorant ou encore Apex Legends profitent énormément du fait d’avoir de haut taux de rafraîchissement : la logique du jeu est capable de calculer beaucoup plus efficacement si vous avez bien tiré au bon endroit ou non. C’est ce décalage entre l’action et la réaction que l’on appelle la latence.

Maintenant… mesurons la latence système d’un jeu compétitif comme Marvel Rivals en utilisant le Multi Frame Generation.

Marvel Rivals Latence du PC 4K/Ultra/DLSS 4 Performance Sans frame generation 13 ms Frame generation x2 18 ms Frame generation x3 19 ms Frame generation x4 21 ms 4K/Ultra/DLSS OFF Sans frame generation 19 ms 1080p/Ultra/DLSS OFF Sans frame generation 17 ms

En 4K, le mode DLSS en mode Performance part d’un rendu du jeu en 1080p qui est mis à l’échelle en 4K. Aussi, la logique du jeu est calculée sur cette base en 1080p, et est d’autant plus optimisée que le reste du rendu est allégé par l’usage du DLSS. Sans DLSS, la latence du jeu est équivalente au mode DLSS 4 avec Frame Generation x3. Sans DLSS, le 1080p a une latence plus élevée que la 4K avec DLSS 4 en mode Performance.

“Oui, mais la latence système mesurée ainsi, ça ne s’exprime pas forcément sur l’input lag”. Très bien : nous avons également collé à notre écran le LDAT qui permet de mesurer la latence sur la transformation des photons à même l’écran, du clic au flash sur une moyenne de 100 tirs mesurés à chaque fois, généralement décrite comme l’input lag. Écran 4K à 240 Hz, VRR (G-Sync) activé, comme un joueur pro l’utiliserait.

Mode Latence mesurée 1080p DLSS OFF 34,9 ms 4K DLSS OFF 33,3 ms 4K DLSS4 Perf MFG xO 22,2 ms 4K DLSS4 Perf MFG x4 33,1 ms

Tests totalement différents, conclusions similaires : le Multi Frame Generation à son niveau le plus élevé correspond à la même latence ressentie en jeu qu’en absence du DLSS ou sur la définition à la base de la mise à l’échelle. Ce qui importe donc vraiment, comme toujours, est d’avoir en base un niveau de FPS moyen assez satisfaisant pour que la logique du jeu puisse se dérouler sans heurts.

Alan Wake 2 Latence du PC 4K/Ultra/DLSS 4 Performance Sans frame generation 33 ms Frame generation x2 42 ms Frame generation x3 44 ms Frame generation x4 47 ms 4K/Ultra/DLSS OFF Sans frame generation 74 ms 1080p/Ultra/DLSS OFF Sans frame generation 28 ms

Enfin, pour les curieux, le même tableau sur une expérience de jeu solo avec Alan Wake 2 où les FPS de base sont en dessous des 100 FPS en 4K. Cet exemple est le plus lourd que nous avons pu mesurer pour un jeu extrêmement exigeant. Et nous n’avons pas encore vu NVIDIA Reflex 2 et son Frame Warp en action pour optimiser ça toujours plus…