#1 02-12-2013 20:33:41

TRINITAS91
Nouveau membre
Âge: 30
Date d'inscription: 02-12-2013
Messages: 2

Histoire des GPU

Bonjour à tous, ce topic vous présentera les différentes générations de GPU (depuis 2006) de Nvidia et AMD/ATI.

On commence par la GeForce 8:

La GeForce 8800 GTX fut le premier modèle a apparaitre au public. A sa sortie, et cela même après les HD2000 de ATI, elle fut la carte la plus performante de son époque, et sa durée a été longue. Son architecture est unifiée, c'est à dire que les unités de calcul Shaders, auparavant divisées en plusieurs types ayant des fonctions distinctes, sont désormais polyvalentes et capables de calculer tous types d'opérations. On peut les appeler sous divers noms suivant le rôle que l'on veut attribuer à ces unités: Processeurs de flux, unités shaders, cores CUDA, etc...

L'architecture des GeForce 8 se nomme "TESLA". Ayant pour nom de code "G80", la version haut de gamme dispose de 128 processeurs de flux répartis sous plusieurs blocs. En effet, la puce est un ensemble de blocs abritant chacun un ensemble d'unités de calculs divers: les processeurs de flux bien entendu, mais d'autres comme les TMU, ou encore les Graphics Engine. Cette organisation permet une meilleure restitution des taches par l'intermédiaire du Contrôleur GPU, une unité spéciale situé à la base du GPU qui a pour rôle de répartir les données suivant leurs types aux composants les plus appropriés. Les caractéristiques du GPU démontrent que la puce dispose de 128 processeurs de flux organisés en 16 blocs. Chaque bloc dispose de 8 processeurs de flux. Il est a noté que les 8 processeurs de flux ne sont pas 100% polyvalents, mais cela concerne seulement quelques rares types de calculs que le commun des mortels utilisent peu, voire carrément pas. Il y a en effet 3 types de processeur de flux: les FMA, les INT et les SFU.

*Les FMA sont les plus employés, ce sont eux qui effectuent non seulement les opérations de shaders pour la 3D, mais aussi les opérations à virgule flottante (le FLOP). Il y a bien sur 2 sous-types: les FMA32 qui effectuent la virgule flottante en simple précision (FP32 ou 32 bits), et les FMA64 qui effectuent les calculs en double précision (FP64 ou 64 bits). Pour le cas de la G80, la double précision n'est pas présente, donc possédera que des FMA32. Il est a noté que les FMA64 peuvent faire du 32 bits, donc participer aux efforts du reste de la puce.
*Les INT sont destinés aux calculs des nombres entiers (donc le contraire du virgule flottante) et se mesure en IOP. Tout comme pour les FMA, il y a des sous-types, mais 3 cette fois-ci: les INT24 (24 bits), les INT32 (32 bits) et les INT64 (Double précision 64 bits). Notons également que certains FMA32 peuvent effectuer du INT, mais opérants sous un cycle d'horloge différent.
*Les SFU sont les moins utilisés, et aussi les moins nombreux. Ils sont destinés a effectuer des calculs spéciaux comme le COS (Cosinus), SIN, LOG, EXP, etc....

Voici donc les caractéristiques des processeurs de flux (ou plutôt leurs répartitions)
             * 128 unités, dont:
                   => 96 FMA32/INT
                   => 32 SFU
La puissance théorique de cet ensemble est la suivante: (Pour la 8800 Ultra qui est la version overclockée de la 8800 GTX)
             => 370 GFLOP en virgule flottante simple précision (FMA32)
             => 370 GIOP en entiers 24 bits
             => 73 GIOP en entiers 32 bits
             => 17 GIOP en entiers 64 bits
             => 93 Giga-opérations/s en SFU

Pour le reste, chaque bloc est relié à un groupe de 2 TMU pour un total de 32 unités. Opérants à 602 Mhz, la puissance théorique est de 19260 méga-texels/s.
L'ensemble est relié à un raster engine qui s’occupe des opérations liés aux triangles. La capacité théorique dépend de la fréquence d'horloge. Opérant aussi à 602 Mhz, cela atteint les les 576 méga-triangles/s.

Après cet ensemble, se trouve un dernier rempart: les ROP. Dernière étape de la 3D, l'unité ROP s’occupe du traitement finale de l'image avant d’être envoyé à la mémoire de la carte avant d’être restitué à l'écran. Chaque ROP ou groupe de ROP est relié à un contrôleur mémoire G-DDR3 de 64 bits. On a un total de 6 contrôleurs 64 bits pour un total de 384 bits. Chaque contrôleur ayant un groupe de 4 ROP. La puissance total est de 14448 méga-pixels/s.

La puce G80 dispose de 684 millions de transistors pour une surface de 484 mm². Le tout gravé en 90 nm.

Voila pour la G80 TESLA. A suivre avec la HD2000 R600...

Vos avis?^^

Hors ligne

 

#2 07-12-2013 15:08:44

Polynesia
Administrateur
Lieu: Alençon
Âge: 45
Date d'inscription: 26-05-2010
Messages: 2501
Site web

Re: Histoire des GPU

Merci


http://goo.gl/pY0Zp * PRPNet (PSA): 3 716 000 + 47 primes

Hors ligne

 

#3 07-12-2013 15:57:25

Damien
Prince of Flood
Date d'inscription: 23-05-2009
Messages: 2157

Re: Histoire des GPU

bienven2

Merci pour ton long 1er message. Je ne suis pas spécialiste, je suppose qu'il n'y a pas d'erreur.


http://statseb.boinc-af.org/signature.py?cpid=e0e2727fa560e6a5151e797a0600ee64

Hors ligne

 

#4 07-12-2013 19:08:03

TRINITAS91
Nouveau membre
Âge: 30
Date d'inscription: 02-12-2013
Messages: 2

Re: Histoire des GPU

Merci à vous^^

Radeon HD2000

Sortie avec 6 mois de retard (ça on s'en souvient^^), la Radeon HD2900 XT représente le haut de gamme de l'architecture R600 du nom de code "PELE".

Tout comme les TESLA G8x, la R600 est basée sur une architecture unifiée, mais pas sous la même organisation cependant. En effet, la R600 est de type vectorielle (alors que les GeForce sont base sur une organisation Scalaire). Cela veut dire quoi?

Une architecture scalaire veut dire que tous les processeurs de flux sont mobilisés pour une tache, et on passe à la suivante.
Une architecture vectorielle veut dire que les processeurs de flux sont séparés par différents blocs qui effectuent de leurs cotés une tache.

La R600 s'appuie donc sur cette manière de fonctionner. Il faut donc s’appuyer sur ces informations pour ne pas tomber dans le petit piège marketing de AMD qui nous dit que la HD2900 XT possède 320 processeurs de flux. Il est vrai que la puce dispose physiquement de ce nombre d'unités shaders, et que question marketing, c'est plus attirant que les 128 unités que composent une 8800 GTX. Mais l'organisation vectorielle de la puce nous révéle que les 320 unités ne fonctionnent pas toutes en même temps.

Passons donc à son organisation physique. La R600 possède 4 blocs contenant 80 processeurs de flux pour un total de 320. Arrêtons nous la:D

Comme on l'a dit plus haut, c'est vectoriel. Donc si on effectue une opération, chaque bloc va effectuer ses propres opérations de leurs cotés. Cela peut être avantageux sur ce point la, c'est plus multi-taches, mais cela exige une certaine programmation pour les développeurs.

Par contre, la constitution des processeurs de flux reste pareil que sous les Nvidia: des FP32, des INT et des SFU. Pas de FP64 également, la double précision n'est pas aussi à l'ordre du jour chez AMD.

Voici l'organisation précise de la R600:
         TOTAL de 320 unités:
                * 4 blocs de 80 unités:
                   => 64 FP32/INT
                   => 16 SFU

La puissance théorique est la suivante:
              => 475 GFLOP en simple précision FP32 (118.75 par blocs)
              => Pas d'informations sur ses capacités en calcul nombre entiers (Dans les environ de 60-65 GIOP/s, ce qui est assez faible)
              => 95 Giga-opérations/s en SFU

Pour le reste, chaque bloc est relié à un groupe de 4 TMU pour un total de 16 unités. Cadencées à 743 Mhz, la puissance théorique est de 11900 méga-texels/s

Chose spéciale pour la R600: Pas de contrôleur mémoire séparé, mais plutôt un ring-bus, sorte de contrôleur unique relié a plusieurs groupe de ROP pour un total de 16 unités. Ce ring-bus a une largeur énorme de 512 bits.

La R600 possède 720 millions de transistors sous un die de 420 mm². Plus de transistors que la G80, mais la puce est moins grande grâce à la gravure en 80 nm (au lieu de 90 nm des Nvidia).

Voila^^

A suivre avec les GeForce 9 et Radeon HD3000....

Hors ligne

 

#5 07-12-2013 22:01:58

gilloox
Prince of Flood
Lieu: France
Âge: 59
Date d'inscription: 19-05-2009
Messages: 2385

Re: Histoire des GPU

Intéressante cette approche des EDLS...

Tu te situe ou dans l'équipe?  http://statseb.boinc-af.org/classement_ … p;projet=0

happy_38

@+

Hors ligne

 

#6 10-12-2013 00:26:03

pas93
Administrateur
Âge: 28
Date d'inscription: 18-05-2009
Messages: 2864
Site web

Re: Histoire des GPU

Bienvenu ici, par contre pas faux le giloox happy_38

Hors ligne

 

Pied de page des forums

Propulsé par FluxBB
Traduction par FluxBB.fr