Accès Membres

Besoin d'aide ?

S'inscrire sur Grid-France.fr

Besoin d'aide ?

Équipe France

Statuts

Vous n'êtes pas identifié.

Annonce

Bienvenue à tous les participants du forum et les lecteurs, nous vous souhaitons une bonne balade en notre compagnie. N'hésitez pas à laisser vos impressions quelque part sur le forum ou sur notre livre d'or. Vous avez des questions ? Vous souhaitez les poser ? Ne vous gênez pas, nous sommes là pour ça !

#1 Attribuer +106/03/2013 20:56:16

TRINITAS
Membre France
Avatar de TRINITAS
Badge(s) de TRINITAS  Âge : 25 ans  Détail de TRINITAS
Envoyer un message privé à TRINITAS  Site web de : TRINITAS

[Topic sur GPU] Histoire des architectures parallèles ATI et Nvidia

Salut à tous 1

Etant un passionné du hardware (et suivant de très prés les évolutions dans ce domaine), je vais vous faire un topo sur les cartes graphiques (Celles qui exploitent l'architecture unifiées) 1

On commence par Nvidia:

          * G80 => GeForce 8800: Première génération exploitant l’architecture unifiée (Donc pour calculs partagés^^) au monde. Utilisant l'architecture scalaire MADD, le nombre d'unités de calculs s’élèvent à 128 pouvant atteindre les 600 GFLOP en simple précision (notons que les doubles précisions n'étaient pas encore gérés). Ces 128 unités sont organisées par 8 blocs de 16 unités scalaires (8x16=128). Pour le grand public, les GeForce 8800 GTX et Ultra étaient de véritables bombes de performances.

         * G92 => GeForce 9800: Deuxième génération, elle n'apporte concrètement rien de nouveau en comparaison des G80, l'architecture reste pratiquement identique (hormis sur le plan de la 3D, où le nombre d'unités TMU a augmenter). La seule amélioration importante est la gravure qui passe de 90 à 55 nm, ce qui permet d'augmenter la fréquence et baisser la consommation. La 9800 GTX+ peut atteindre les 700 GFLOP. Notons également que la gamme des GeForce 9 aura une carte bi-gpu: la 9800 GX2 qui permettra d'atteindre la barre des 1 TFLOP en simple précision.

         * TESLA GT200 => GeForce GTX200: Troisième génération, elle est l'évolution des G80 (car utilisant l'architecture MADD également), le nombre de blocs a augmenté de 8 à 10 blocs de 24 unités scalaires, ce qui permet d'atteindre les 240 unités au total pour une puissance maximale (normale) de 1 TFLOP pour la GeForce GTX285. Une carte bi-gpu est également apparu pour presque atteindre les 2 TFLOP: la GTX295. Notons que la génération des Tesla fut la première génération à prendre en charge les calculs en double précision (mais encore à une faible puissance: 85 GFLOP pour la GTX285).

         * FERMI GF100/GF110 => GeForce GTX400/GTX500: Quatrième génération, l'architecture Fermi utilise les unités scalaires SM (et non MADD). La GF100 animant la GTX480 dispose de 480 unités scalaires réparties par 16 blocs disposant de 32 unités SM. Consommant beaucoup, Nvidia sort la GTX580 utilisant la GF110 qui est le Fermi qui aurait du être sous la GF100: 512 unités sous 17 blocs de 32 unités. La génération Fermi bien que dépassée en calcul simple précision à l'heure actuelle (maximum 1.5 TFLOP pour la GF110), elle reste malgré tout très efficace en double précision où la GF110 atteint 650 GFLOP (ce qui est non négligeable). Les GTX500 auront une bi-gpu: la GTX590 qui permettra de dépasser les 2 TFLOP en FP32, et atteindre la barre symbolique des 1 TFLOP en FP64.

         * KEPLER GK104/GK110 => GeForce GTX600/GTX700: Basée sur les Fermi, les Kepler utilisent les unités SMX (plus efficaces). La GK104 posséde 1536 unités scalaires répartis sous 8 blocs SMX possédants 192 unités scalaires. Atteignant les 3 TFLOP, la GK104 est donc très efficace en simple précision, mais elle est bridée en double précision où sa valeur est 1/24 du FP32. Pour le moment, seule la GK110 qui anime la GTX Titan avec ses 2688 unités (14x192) peux calculer en double précision efficacement (1.5 TFLOP) et atteindre les 5 TFLOP en FP32. Espérons que les GK114 feront de même.

         * MAXWEL GM100/GM110 => GeForce GTX800: Sixième génération, on ne sait que peu de choses, hormis qu'elles intégreront un processeur ARM et posséderont le double d'unités face à la GK110. Des infos comme quoi la génération Maxwel sera organisée de la même façon que les Kepler (GTX800 bridée, et GTX900 Max).

         * EINSTEIN GE100 => GeForce GTX1000?: Aucune information, hormis que Nvidia à précisé que cette génération marquera un grand tournant (un peu à l'image des GeForce 8 face à la vieille architecture vectorielle des GeForce256 à 7).

La suite aprés pour ATI/AMD^^

Hors ligne

  • Citer

#2 Attribuer +106/03/2013 21:33:16

ALAIN_13013
Modérateur
Avatar de ALAIN_13013
Badge(s) de ALAIN_13013  Âge : 46 ans  Détail de ALAIN_13013
Envoyer un message privé à ALAIN_13013

Re: [Topic sur GPU] Histoire des architectures parallèles ATI et Nvidia

35 super, un très bon topo sur Nvidia Merci

Hors ligne

  • Citer

#3 Attribuer +106/03/2013 21:50:31

satanson
Modérateur
Avatar de satanson
Badge(s) de satanson  Âge : 31 ans  Détail de satanson
Envoyer un message privé à satanson

Re: [Topic sur GPU] Histoire des architectures parallèles ATI et Nvidia

plus1

Hors ligne

  • Citer

#4 Attribuer +107/03/2013 01:48:00

Yeti_73
Modérateur
Avatar de Yeti_73
Badge(s) de Yeti_73  Détail de Yeti_73
Envoyer un message privé à Yeti_73

Re: [Topic sur GPU] Histoire des architectures parallèles ATI et Nvidia

Merci  Merci



Je peux résister à tout, sauf à la tentation.

Hors ligne

  • Citer

#5 Attribuer +107/03/2013 15:33:57

TRINITAS
Membre France
Avatar de TRINITAS
Badge(s) de TRINITAS  Âge : 25 ans  Détail de TRINITAS
Envoyer un message privé à TRINITAS  Site web de : TRINITAS

Re: [Topic sur GPU] Histoire des architectures parallèles ATI et Nvidia

Merci à vous^^

Je continue avec ATI^^:

            * PELÉ R600 => Radeon HD2900: Première génération d'architecture unifiée chez ATI (sortie avec un gros retard), elle fut une déception: Pas mal de bug, mauvaise exploitation, performance limite (parfois inférieure à une GeForce 8800GTS). Surtout la consommation qui dépasse les 210 Watts (en comparaison des 170 Watts de la 8800 Ultra pour des performances bien supérieures). Son architecture bien qu'unifiée est vectorielle, et utilise les unités MADD. Elle est organisée en 10 blocs de 32 unités chacune pour un total de 320 unités atteignant les 470 GFLOP.

            * BOOM RV670 => Radeon HD3800: Deuxième génération, issue des HD2000, elle corrige les nombreux défauts de celle-ci, et avec brio: la HD3870 a des performances enfin à la hauteur d'une 8800GTS 640 Mo. Sa gravure passe au 55 nm pour une consommation enfin maîtrisée de seulement 106 Watts. La HD3870 atteint les 500 GFLOP en simple précision. Notons que la RV670 sera la première architecture unifiée à calculer en double précision (bien avant donc Nvidia et ses Tesla) pour atteindre les 100 GFLOP. 2 cartes bi-gpu sont apparus: les HD3850 X2 et HD3870 X2 (900 GFLOP FP32- 210 GFLOP FP64).

           * WEKIVA/SPARTAN RV770/RV790 => Radeon HD4800: Troisième génération, issue des R600, les R700 utilisent toujours du vectorielle MADD. Le nombre de blocs reste identique (10), mais le nombre d'unités de 32 à 80 pour un total de 800 unités. La RV790 HD4890 atteint les 1.2 TFLOP en simple précision et 240 GFLOP en FP64. 2 cartes bi-gpu apparues: HD4850 X2 et HD4870 X2 pour une puissance de 2.4 TFLOP FP32 et  presque 500 GFLOP en FP64. (Point qui rend cette famille Radeon supérieure aux GTX200 trés faible en FP64).

           * EVERGREEN RV870 => Radeon HD5800: Quatrième génération, issue des R700, les R800 optimise ses fonctionnalités et ajoute le support de DirectX 11. Le nombre de blocs à 20 avec toujours 80 unités pour un total de 1600 unités. L'augmentation des unités et les optimisations apportées permettent à la HD5870 d'atteindre les 2.4 TFLOP en simple précision et 544 GFLOP en double précision. Une carte b-gpu est apparue: la HD5970, un monstre qui atteint les 4.7 TFLOP en FP32 et 1 TFLOP en double précision (barre symbolique).

           * NORTHERN ISLANDS RV970 => Radeon HD6900: Cinquième génération, issue des R800, les R900 auront des optmisations (pour certains particuliéres): par exemple, le nombre de blocs augmente de 20 à 24  de 64 unités pour un total de 1536 unités. Malgré cela, la puissance en simple précision reste globalement inchangée en 2 TFLOP pour la HD6970, par contre, les optimisations apportées améliore la double précision qui passe de 544 GFLOP (5870) à presque 700 GFLOP (c'est pas rien, et de surcroît surpasse la GTX580 et ses 500 GFLOP). Une bi-gpu est bien entendu sortie: la HD6990 qui atteint les 5 TFLOP (équivalent à une GTX690) et 1.3 TFLOP en double précision.

           * SOUTHERN ISLANDS RV1070 => Radeon HD7900: Sixiéme génération, les R1000 sont une remise à zéro, plus d'unités MADD, ni d'organisation vectorielle SIMD. On passe désormais à du scalaire SM. (par contre, j'ai pas d'informations sur son organisation). Totalisant 2048 unités scalaires, la HD7970 atteint les 4.3 TFLOP en simple précision et 1.1 TFLOP (les FP64 restent inchangées). Asus a sorti une Ares II qui réunit 2 RV1070 pour une puissance incroyable de 8.2 TFLOP en simple précision et 2 TFLOP en FP64.

           * SEA ISLANDS RV1170 => Radeon HD8900: Septiéme génération, issue des R1000, les R1100 sont une amélioration (un peu à l'image des Kepler GK11x face au kepler GK10x). Egalement pas d'infos sur son organisation, hormis que la HD8970 atteindra les 2560 unités.

           * VOLCANIC ISLANDS RV1270 => Radeon HD9900: Pas d'infos.

           * PIRATES ISLANDS RV1370 => Radeon HD10900?: pas d'infos.

Hors ligne

  • Citer

Actions & liens

Utilisateurs présents sur ce topic : Invités

Forum EF WCG

Remonter en haut de la page

Association et calcul partagé, vous êtes partant ?

Ce site est le site de l'équipe France du calcul partagé (médical et climatique). Mentions légales | Contact