GT200 Şl RV770 NOILE NUCLEE GRAFICE

Posted on 17 July 2008 by Tehnomaniac

NVIDIA ATI

Odată cu apariţia nucleelor grafice RV670 de la AMD/ATI şi G92 de la NVIDIA, competiţia pe piaţa acceleratoarelor grafice dedicate a fost relansată, aducând cu sine preţuri mult mai accesibile. Cu toate acestea, singurele produse care ridicau bara performanţelor oferite au fost modelele dual-GPU, Radeon HD 3870X2 şi GeForce 9800GX2. De această dată, noile nuclee grafice lansate au fost proiectate pentru a oferi un nivel cât mai înalt al performanţei. GT200 de la NVIDIA se laudă cu cel mai mare număr de tranzistoare şi cea mai mare suprafaţă a pastilei, în timp ce RV770 oferă un număr fără precedent de stream processors şi un raport performanţă/preţ foarte bun.

Lansarea plăcilor grafice din seria Radeon HD 3800 motorizate de nucleul grafic RV670 a reprezentat un incontestabil succes pentru AMD/ATI. Acest fapt s-a datorat parţial disponibilităţii reduse a plăcilor grafice motorizate de nucleul G92 în primele două luni de la lansare, însă în principal raportului performanţă/preţ foarte bun oferit şi a consumului de curent scăzut datorat procesului de fabricaţie pe 55nm. Replica celor de la NVIDIA a venit sub forma scăderii preţurilor modelelor GeForce 8800GT şi creşterea disponibilităţii acestora. De asemenea, lansarea unor modele noi, precum GeForce 8800GTS cu nucleu G92, precum şi a modelelor din seria GeForce 9000, au întărit poziţia NVIDIA pe piaţă, slăbită şi de lansarea modelului Radeon HD 3870X2.

în tot acest timp însă, atât NVIDIA, cât şi AMD/ATI, au lucrat la noua generaţie de nuclee grafice. Plăcile grafice Radeon din seria HD 3000 şi GeForce din seria 9800 au fost, cu excepţia modelelor dual-GPU, doar o perfecţionare a plăcilor din seria anterioară. Noile serii de plăci video lansate reprezintă atingerea unor nivele de performanţă superioare pentru ambele companii, proiectarea acestor nuclee ilustrând pe deplin acest fapt. Cu toate acestea, strategia fiecărei companii diferă destul de mult de abordările precedente, amintind de cele de acum zece ani sau mai mult.

Se poate spune că strategia abordată de NVIDIA este una clasică, însă nu în totalitate. Accentul este pus pe proiectarea unui model pentru segmentul enthusiast cât mai performant, celelalte segmente fiind acoperite folosind chipurile din generaţiile anterioare. Astfel, segmentul enthusiast este adresat de modelele GeForce GTX 260 şi GTX 280, segmentul performance de către GeForce 9800GTX şi 9800GTX+, segmentul mainstream de plăcile grafice GeForce 9600GT şi 9600GSO, categoria entry-level fiind acoperită de vechile GeForce 8600GT. Noile nuclee grafice proiectate pentru segmentul enthusiast sunt denumite GT200 şi reprezintă o continuare a tradiţiei NVIDIA de a oferi un nivel cât mai înalt de performanţă într-un singur nucleu grafic, indiferent de costurile pe care le implică un asemenea proiect. Restul segmentelor sunt acoperite de modele din generaţiile anterioare, eventual aduse la zi prin folosirea unui proces de fabricaţie mai bun şi creşterea frecvenţelor de funcţionare uneori. Modelele oferite pentru restul segmentelor folosesc nucleul grafic G92 sau un derivat al acestuia, denumit G94, pentru GeForce 9600GT, datorită preţului relativ scăzut de producţie.

NVIDIA va înlocui nucleul grafic G92 cu G92b pentru a scădea costurile de producţie, G92b fiind realizat folosind procesul de fabricaţie pe 55nm. Aceasta este o abordare destul de eficientă, costurile necesare pentru efectuarea tranziţiei de la 65nm la 55nm fiind mult mai mici decât cele necesare pentru proiectarea unor modele noi. De asemenea, disponibilitatea plăcilor ce vor folosi nucleul G92b va fi probabil ridicată deoarece restul componentelor sunt deja produse în masă. Singura variabilă rămâne capacitatea de a livra îndeajuns de multe nuclee grafice G92b.

Strategia folosită de AMD/ATI este una cu totul deosebită, mizând pe oferirea unui nivel cât mai înalt de performanţă în paralel cu un consum cât mai scăzut şi un preţ de comercializare cât mai convenabil pentu utilizatori. Proiectarea unui nucleu grafic de top pentru segmentul enthusiast implică costuri ridicate, iar amortizarea costurilor de proiectare şi producţie se face foarte greu din cauza numărului mic de utilizatori care îşi permit asemenea modele. De asemenea, în încercarea de a oferi cel mai înalt nivel de performanţă, sunt sacrificate aspecte precum eficienţa energetică. Pentru a reduce costurile de proiectare, de implementare şi implicit, pentru a reduce preţul de achiziţie, AMD/ATI au abordat acest segment într-un mod deosebit, asemănător cu metodele utilizate de 3dfx acum mai bine de zece ani. Astfel, AMD/ATI îşi concentrează eforturile în proiectarea unui nucleu grafic cât mai performant pentru segmentul performance, dimensiunile acestuia şi consumul de curent fiind menţinute la un nivel cât mai scăzut.

Segmentul enthusiast este adresat prin intermediul unui model ce foloseşte două asemenea nuclee grafice pe o singură placă. Tehnologia CrossFire dezvoltată de ATI permite realizarea unui asemenea model cu costuri minime de proiectare, disponibilitatea fiind ridicată datorită producţiei de masă a nucleelor grafice folosite. Există şi o parte negativă în privinţa folosirii unui asemenea design. Pentru a obţine un spor semnificativ de performanţă sunt necesare drivere bune. Cu toate acestea, costurile relativ mici aferente comercializării unui asemenea model compensează pentru acest risc şi oferă o alternativă foarte performantă unui public ţintă mai larg.

Pentru a acoperi segmentele mainstream şi entry-level, vor fi lansate modele noi. Acestea vor fi denumite seria HD 4600 pentru mainstream şi HD 4400 pentru entry-level. Plăcile grafice din seria HD 4600 vor concura cu seria GeForce 9600, iar cele din seria HD 4400 vor continua pe linia începută de plăcile Radeon HD 2400. Posibilitatea de a folosi până la patru nuclee grafice în paralel într-o configuraţie CrossFireX este oferită în continuare utilizatorilor entuziaşti.

 

NVIDIA GT200

NVIDIA GT200

Nucleul GT200 dezvoltat de NVIDIA este cel mai puternic nucleu grafic construit până la ora actuală. GT200 are foarte multe în comun cu nucleul G80 la nivel arhitectural, însă este mult mai puternic datorită numărului aproape dublu de procesoare unificate de shader şi a procesării în dublă precizie a calculelor cu virgulă mobilă. NVIDIA oferă la ora actuală două plăci grafice care folosesc nucleul GT200, anume GeForce GTX 280 şi GeForce GTX 260. GeForce GTX 280 dispune de 240 de procesoare unificate de shader, spre deosebire de cele 128 folosite de nucleul G80 ce motorizează plăcile GeForce 8800GTX. La frecvenţele standard de 602MHz pentru nucleul grafic şi 1296MHz pentru procesoarele unificate de shader, GeForce GTX 280 poate procesa aproximativ 933GFLOPS de date, o cantitate mai mult decât impresionantă. GeForce 8800GTX poateprocesa doar 518GFLOPS la frecvenţele standard.

Pentru a oferi o lăţime de bandă adecvată unei asemenea puteri de procesare, este folosită o interfaţă cu memoria grafică pe 512 biţi, pentru care sunt folosite în total opt controllere pe câte 64 biţi fiecare. Pentru a alcătui cantitatea de 1GB de memorie de care dispune acest model sunt utilizate 16 chip-uri de memorie, câte opt pe fiecare parte a PCB-ului. Tipul de memorie folosită este GDDR3 la 2214MHz, totalizând o lăţime de bandă de 142GB/S. Comparativ, plăcile GeForce 8800GTX cu design de referinţă dispuneau doar de 86GB/S. Sunt folosite în total 30 de unităţi ROP, acestea suferind îmbunătăţiri faţă de nucleele precedente. Astfel, nucleul grafic GT200 folosit pentru realizarea lui GeForce GTX 280 poate procesa 19 GBlends/s faţă de doar 7 GBlends/s pentru GeForce 8800GTX. Texture fillrate-ul specificat este de de 48 GTexeli/s, faţă de 37 GTexeli/s pentru GeForce 8800GTX, una dintre cele mai mici creşteri în favoarea GT200. Acest fapt se datorează folosirii a doar 80 de unităţi TMU, comparativ cu cele 64 folosite pentru GeForce 8800GTX.

Consumul maxim estimat pentru GeForce GTX 280 este de 236W, fiind necesară folosirea a doi conectori de alimentare suplimentară, unul cu şase pini şi unul cu opt pini. Pentru a oferi sunet direct prin intermediul conctorilor DVI este necesară conectarea plăcii grafice la placa de sunet a sistemului prin intermediul unui cablu special. GeForce GTX 280 este dotat cu doi conectori Dual-Link DVI şi unul HDTV-Out. Sistemul de răcire folosit este asemănător cu cel folosit pentru plăcile GeForce 9800GTX, însă diferenţele sunt apreciabile. Ventilatorul folosit este de tip centrifugal, având 80mm în diametru. Cu toate că turaţia ventilatorului este redusă, în regim full load acesta este turat la maxim, zgomotul emis fiind deranjant. Dimensiunile radiatorului folosit sunt mult mai mari decât cele ale radiatorului folosit pentru GeForce 9800GTX. Materialele folosite pentru realizarea sa sunt cuprul şi aluminiul, fiind utilizate nu mai puţin de şapte heatpipe-uri pentru răcirea nucleului grafic. Pentru a răci chip-urile de memorie de pe spatele PCB-ului este folosită o placă metalică vopsită în negru. Sistemul de răcire acoperă întreaga suprafaţă a plăcii, conferind un aspect deosebit acestor plăci.

Modelul mai ieftin, GeForce GTX 260, foloseşte un nucleu grafic GT200 tactat la 576MHz, care dispune de doar 192 de procesoare unificate de shader tactate la 1242MHz. De asemenea, interfaţa cu memoria grafică este pe 448 biţi, unul dintre cele opt controllere de memorie pe 64 biţi fiind dezactivat. Numărul de unităţi ROP este de 24, cantitatea de memorie grafică disponibilă fiind de 896MB. Sunt folosite 14 chip-uri de memorie, dispuse în acelaşi fel ca la GeForce GTX 280. Frecvenţa memoriei RAM este de 1998MHz. Lăţimea de bandă specificată este de 111 GB/s. Consumul maxim estimat pentru GeForce GTX 260 este de 182W, fiind necesară folosirea a doar doi conectori de alimentare cu şase pini. Lungimea ambelor modele este identică cu cea a plăcilor GeForce 9800GX2.

Tehnologiile implementate de nucleul GT200 sunt PCI-Express 2.0, NVIDIA 3-way SLI, NVIDIA PhysX, NVIDIA CUDA, NVIDIA HybridSLI şi HybridPower şi PureVideo HD. Un aspect controversat este lipsa instrucţiunilor DirectX 10.1, nucleul GT200 conţinând doar instrucţiunile DirectX 10. In jocurile care utilizează instrucţiunile DirectX 10.1, precum Asassin’s Creed, se observă creşteri semnificative de performanţă în cazul plăcilor grafice care folosesc API-ul DirectX 10.1, decizia celor de la NVIDIA fiind şi mai greu de înţeles în contextul în care API-ul DirectX 10 a apărut de aproximativ un an şi jumătate.

Odată cu achiziţionarea companiei AGEIA, NVIDIA au început lucrul la implementarea procesării calculelor de fizică prin intermediul nucleului grafic. Driver-ul ForceWare 177.39 lansat de NVIDIA special pentru a implementa PhysX a iscat deja o serie de controverse în privinţa scorului obţinut în 3DMark Vantage, mai exact în cel de-al doilea test de CPU. Prin instalarea driver-ului ForceWare 177.39, a unei versiuni anume de driver PhysX şi modificarea unor DLL-uri, testul de fizică din 3DMark Vantage este rulat în întregime pe nucleul grafic în loc de procesorul de sistem. Acest fapt contravine cu prevederile Futuremark pentru obţinerea unui scor valid în 3DMark Vantage, scorurile obţinute astfel nefiind recunoscute drept oficiale pentru obţinerea unei poziţii în clasamentul mondial sau pentru comparaţii. Răspunsul NVIDIA a fost că driver-ul în cauză avea doar scop demonstrativ, nefiind trimis pentru validare către Futuremark, singura schimbare fiind înlocuirea procesorului de sistem cu cel grafic pentru efectuarea acelui test. Răspunsul celor de la Futuremark a fost că din moment ce driver-ul nu a fost validat, scorurile obţinute astfel nu sunt valabile şi că, deşi tehnologia în cauză este una inovatoare, pentru moment nu va fi adăugat suport în 3DMark Vantage. La ora actuală, avantajele oferite de NVIDIA PhysX pot se pot vedea în doar două circumstanţe, anume în testul de procesare fizică din 3DMark Vantage şi în unele hărţi special lansate pentru Unreal Tournament III.

Procesul de fabricaţie pe 65nm, alături de cei aproximativ 1.4 miliarde de tranzistoare, fac ca nucleul GT200 să fie cel mai mare nucleu grafic produs până la ora actuală, mai mare chiar decât nucleul R600 de la AMD/ATI. Suprafaţa pastilei este de 576mm pătraţi, comparativ cu 484mm pătraţi pentru nucleul G80. Folosind waffer-e de 300mm în diametru, pot fi fabricate aproximativ 95 de asemenea nuclee grafice per waffer. Din cauza dimensiunii pastilelor şi a procesului de fabricaţie pe 65nm, rata de apariţie a defectelor pare să fie destul de mare. Unele zvonuri indică faptul că doar 40% din pastilele produse pot fi folosite, însă nu se precizează dacă pastilele în cauză sunt cele folosite pentru modelul GTX 280 sau pentru GTX 260. De asemenea, folosirea unui PCB ce implementează o interfaţă cu memoria grafică pe 512 biţi creşte rata de apariţie a defectelor de fabricaţie. Toate aceste fapte luate la un loc indică faptul că preţul de comercializare al plăcilor grafice GTX 280 şi GTX 260 nu va putea fi micşorat considerabil în viitorul apropiat din cauza costurilor ridicate de producţie. Preţurile specificate de NVIDIA la lansare pentru plăcile grafice din noua serie erau de 499$ pentru GTX 260 şi 649$ pentru GTX 280.

AMD/ATI RV770

AMD/ATI RV770

Prezentarea oficială a noilor nuclee grafice RV770 de la AMD a avut loc pe 19 iunie, pe Costa del Sol, la Marea Mediterană. Strategia abordată de către cei de la AMD/ATI se regăseşte complet în proiectarea nucleului RV770. Pentru a spori cât mai mult atractivitatea noilor produse şi a înregistra vânzări cât mai mari, noua strategie AMD/ATI se bazează pe oferirea unui nivel cât mai înalt de performanţă, în condiţiile unui consum de curent cât mai scăzut şi al unor preţuri cât mai mici. Pentru a atinge acest obiectiv, punctele forte ale noii arhitecturi sunt procesul de fabricaţie pe 55nm şi implicit suprafaţa de 260mm pătraţi ai pastilei. Consumul de curent este menţinut la un nivel scăzut prin intermediul procesului de fabricaţie pe 55nm şi cu ajutorul funcţiei PowerPlay de reducere a consumului în funcţie de cerinţele de procesare.

Comparativ cu nucleul RV670, noul nucleu RV770 beneficiază de îmbunătăţiri din toate punctele de vedere la nivel de performanţă. Unul dintre aspectele care au surprins la RV770 este numărul de procesoare unificate de shader cu care este dotat. Zvonurile iniţiale raportau prezenţa a 480 de asemenea procesoare, însă numărul final de asemenea procesoare este de 800, faţă de 320 pentru nucleul RV670. Numărul de procesoare unificate de shader nu este comparabil între nucleele produse de AMD/ATI şi cele produse de NVIDIA, abordările fiind diferite. în timp ce nucleele grafice NVIDIA folosesc un multiplicator de frecvenţă pentru a creşte semnificativ viteza procesoarelor unificate de shader de care dispun, nucleele AMD/ATI folosesc două tipuri de asemenea procesoare, frecvenţa de lucru a acestora fiind cea a nucleului. Astfel, dintre cele 800 de procesoare unificate de shader, 160 sunt de tip precizie dublă, restul de 640 fiind de tip normal. Procesoarele sunt grupate câte cinci, numai unul putând procesa calcule cu precizie dublă. Acest tip de implementare a fost folosit prima dată în realizarea nucleelor grafice R580 ce motorizau plăcile Radeon X1900. Numărul de unităţi de texturare a fost crescut de la 16 la 40. Numărul de unităţi ROP a fost păstrat la 16, însă acestea au fost reproiectate şi optimizate pentru a facilita Antialiasing-ul. Astfel, în cazul funcţiei Antialiasing pe 32 biţi sau 64 biţi, pot fi procesaţi până la 16 pixeli per clock pentru Antialiasing 2x/4x, dublu faţă de cât poate procesa nucleul RV670. Numărul de tranzistoare al nucleului RV770 este de 956 milioane, faţă de 666 milioane pentru RV670.

Puterea de procesare pusă la dispoziţie de nucleul grafic RV770 necesită o lăţime de bandă indeajuns de mare pentru a putea fructifica potenţialul oferit. Pentru a menţine un preţ de comercializare scăzut, AMD au optat pentru păstrarea interfeţei cu memoria grafică pe 256 biţi prezentă pe plăcile motorizate de nucleul RV670. Pentru a compensa, au fost introduse schimbări semnificative şi tehnologii noi. în primul rând, s-a renunţat la folosirea controller-ului de memorie de tip ring-bus, în favoarea unui controller de memorie bazat pe un design mai normal. Astfel, interfaţa cu memoria grafică pe 256 biţi este realizată prin intermediul a patru controllere pe 64 biţi. Fiecare dintre aceste patru controllere de memorie este aşezat lângă un grup de câte patru unităţi ROP şi L2 cache, oferind o viteză sporită. Ceea ce a atras atenţia din primul moment asupra plăcilor grafice din seria Radeon HD 4800 a fost anunţul că vor utiliza memorie GDDR5 şi mai ales frecvenţele la care funcţionează aceasta. Diferenţa majoră între memoriile GDDR3 şi cele GDDR5 este că cele din urmă sunt de tip Quad Data Rate, nu Double Data Rate. Astfel, frecvenţa efectivă de lucru este de patru ori mai mare decât cea de bază, rezultând o lăţime de bandă fără precedent. Modelele Radeon HD 4870 actuale folosesc chip-uri de memorie GDDR5 ce oferă o frecvenţă de lucru efectivă de 3.6GHz. Combinând cei 3.6GHz ai memoriei GDDR5 cu interfaţa cu memoria grafică pe 256 biţi, rezultă o lăţime de bandă de 115.2 GB/s. O asemenea lăţime de bandă este impresionantă în condiţiile folosirii unei interfeţe cu memoria grafică pe doar 256 biţi, plăcile grafice Radeon HD 3870, dotate cu memorie GDDR4 la o frecvenţă de lucru efectivă de 2252MHz oferind doar 72 GB/s.

Iniţial, atât Radeon HD 4870, cât şi Radeon HD 4850, urmau să folosească memorie GDDR5, ulterior urmând sa fie lansat un model de Radeon HD 4850 cu memorie GDDR3. Din cauza disponibilităţii reduse a chip-urilor de memorie GDDR5, toate plăcile Radeon HD 4850 disponibile la ora actuală vor folosi memorie GDDR3, memoriile GDDR5 fiind rezervate pentru Radeon HD 4870. Diferenţele de performanţă între modelele Radeon HD 4850 şi Radeon HD 4870 actuale sunt date de frecvenţe şi tipul de memorie folosită. Modelele Radeon HD 4850 folosesc o frecvenţă de 625MHz pentru nucleul grafic RV770, alături de o frecvenţă de lucru efectivă de 1986MHz pentru cei 512MB de tip GDDR3. Nucleul grafic RV770 ce motorizează modelele Radeon HD 4870 este tactat la 750MHz, cei 512MB de tip GDDR5 folosind o frecvenţă de lucru efectivă de 3600MHz.

Consumul de curent al noilor modele se încadrează în politica actuală a celor de la AMD/ATI. Astfel, Radeon HD 4850 are un TDP de doar 110W, pentru Radeon HD 4870 fiind specificat un consum de 160W maximum. Acest fapt este pe deplin ilustrat de construcţia noilor plăci. Radeon HD 4870 foloseşte un design al PCB-ului aproape identic cu cel al plăcilor din seria Radeon HD 3850/3870, diferind aranjarea chip-urilor de memorie şi complexitatea circuitelor. Este necesară folosirea unui singur conector de alimentare auxiliară cu şase pini. Sistemul de răcire folosit este de tip single slot, fiind aproape identic cu cel folosit pentru modelele Radeon HD 3850. Diferenţele constau în folosirea unui ventilator mai bun şi design-ul mai bun al radiatorului, facilitând evacuarea căldurii prin partea superioară a plăcii. Radeon HD 4870 foloseşte un PCB complet nou, designul fiind asemănător cu cel al plăcilor Radeon HD 2900. Spre deosebire de cele din urmă, sunt folosiţi doi conectori de alimentare auxiliară cu şase pini. Sistemul de răcire folosit pentru Radeon HD 4870 este aproape identic cu cel folosit pentru plăcile Radeon HD 2900, diferenţa constând în realizarea lamelelor din aluminiu în loc de cupru şi design-ul ramei de plastic. Lungimea PCB-ului ambelor modele este identică cu cea a plăcilor din seria Radeon HD 3800.

Nucleul grafic RV770 oferă suport pentru instrucţiunile DirectX 10.1, PCI-Express 2.0, CrossFireX cu până la patru plăci grafice şi Hybrid CrossFire. Pentru decodarea semnalului video în format Blu-Ray şi HD-DVD este oferită tehnologia UVD 2.0. Utilizatorii beneficiază acum de implementarea unui codec audio 7.1 direct pe placa video, fiind posibilă transmiterea semnalului audio şi video direct prin intermediul unui singur cablu HDMI. Fiecare placă Radeon HD 4800 este livrată cu un adaptor DVI-to-HDMI special pentru această funcţie.

Pentru a oferi o alternativă la tehnologia NVIDIA PhysX, AMD vor implementa tehnologia Havok de procesare a calculelor fizice de către nucleul grafic, ceea ce reprezintă o colaborare indirectă între AMD şi Intel. Nu a fost anunţată o dată oficială pentru lansarea unor drivere noi pentru această funcţie, însă la ora actuală se lucrează pentru implementarea noii tehnologii.

Preţurile noilor plăci grafice lansate de AMD/ATI sunt printre cele mai mici la lansare din istoria segmentului performance. Astfel, modelul Radeon HD 4850 cu 512MB GDDR3 este estimat la 199$, performanţa lui Radeon HD 4870 cu 512MB GDDR5 fiind cotată de către AMD la 299$. Noile plăci grafice Radeon HD 4850 cu memorie GDDR3 vor fi disponibile imediat în cantităţi suficiente.Numărul de plăci grafice Radeon HD 4870 disponibile în primele săptămâni de la lansare va fi redus, din cauza disponibilităţii reduse a memoriilor GDDR5 momentan.

 

CONCLUZIE

Noile plăci video lansate oferă un nivel ridicat al performanţelor, în special pentru utilizatorii care doresc obţinerea unor performanţe bune la rezoluţii mari. GeForce GTX 280 nu a putut depăşi GeForce 9800GX2 per total, fiind superioară doar la rezoluţii mari alături de activarea AA şi AF. Cu toate că NVIDIA deţin în continuare coroana performanţei, modelele Radeon din seria HD 4800 oferă cu siguranţă cel mai bun raport performanţă/preţ disponibil la ora actuală, scalabilitatea oferită în CrossFire de două plăci Radeon HD 4850 fiind bună.

Sursa : (  Extreme Pc )

Popularity: 27% [?]

Articole asemanatoare

Leave a Reply

Advertise Here