AMD Radeon HD 5870
AMD je pred sami početak četvrtog kvartala predstavio novu generaciju grafičkih kartica baziranih na Evergreen arhitekturi sa podrškom za DirectX 11 API te čitav niz zanimljivih tehnologijama među kojima prednjači Eyefinity multi-monitor tehnologija. Kakve su performanse Radeon HD 5870 kartice u odnosu na šampione prethodne generacije te da li je sada pravi trenutak za nadogradnju, saznajte u nastavku.
Uvod i arhitektura
Uvod
Mnogi će se prisjetiti da su prvi detalji vezani za Evergreen seriju grafičkih kartica objavljeni još početkom juna, kada su objavljene i prve informacije o DirectX 11 API-u. Sa zvaničnim predstavljanjem nove generacije grafičkih kartica, AMD je tržištu ponudio dva modela: ATI Radeon HD 5850 i ATI Radeon HD 5870. Naknadno su predstavljene i ATI Radeon HD 5770 grafičke kartice, namijenjene srednjem tržišnom segmentu, a o čemu ste već imali prilike čitati na našim stranicama.
Poučeni uspjehom prethodnih generacija grafičkih kartica, u AMD-u su odlučili slijediti istu poslovnu strategiju, pa su napravili grafički procesor pozicioniran tako da zadovolji potrebe srednjeg i višeg tržišnog segmenta. Kada je u pitanju apsolutni high-end tržišni segment, AMD će kao i ranije ponuditi grafičku karticu sa dva grafička čipa.
Grafičke kartice pod kodnim imenom Hemlock, već su najavljene, i na tržištu bi se trebale pojaviti do kraja tekuće godine. U nižim tržišnim segmentima, AMD će predstaviti grafičke kartice kodnog imena Redwood i Cedar, bazirane na istoj mikroarhitekturi, s kojima će se početkom sljedeće godine, DirectX 11 podrška obezbjediti i u entry tržišnom segmentu.
Arhitektura
Iako se radi o potpuno novom grafičkom procesoru, Cypress na nivou mikroarhitekture dijeli brojne zajedničke karakteristike sa grafičkim procesorima iz RV700 porodice. Cypress jezgra ima površinu od 334mm², što je znatno više od 260mm², kolika je površina RV770 jezgra korištenog na Radeon HD 4870 grafičkima karticama. Zahvaljujući 40nm proizvodnom procesu, na površini od 334mm² raspoređeno je 2.15 milijardi tranzistora, dok za usporedbu, RV770 ima tek 956 miliona tranzistora. Veća jezgra za sobom povlači i višu cijenu, pa su preporučene cijene za Cypress 5850 i 5870 grafičke kartice 379USD i 259USD.
Cypress predstavlja svojevrsnu nadogradnju RV770 arhitekture, pa je za razumijevanje Cypress arhitekture i načina na koji ovaj čip radi potrebno osnovno poznavanje RV770 arhitekture, a zbog čega vam preporučujemo da pročitate neku od stariji recenzija grafičkih kartica iz prethodne generacije. Osnovu ove arhitekture čini stream ili thread procesor, koji je ujedno i najmanja jedinica sposobna za izvršavanje instrukcije. Stream procesor (thread procesor) se sastoji od pet stream jezgri, registra i algoritma za predviđanje. Jedna od stream jezgri je nešto naprednija od ostalih, te je sposobna za izvršavanje transcedentalnih funkcija.
Stream procesori se u grupama po šesnaest jedinica dalje skupa s jedinicama za teksturisanje, L1 cache mamorijom, dijeljenom memorijom i kontrolnom logikom grupiraju u SIMD blokove (Single Instruction, Multiple Dana). SIMD blok dakle sadrži 80 stream jezgri. RV770 ima deset ovakvih SIMD blokova, dok Cypress ima dvije grupe po deset SIMD blokova, što na kraju rezultira brojkom od čak 1600 stream jezgri ili shadera. Svakom SIMD jezgru dodijeljene su četiri teksturne jedinice, što znači da ih je ukupno 80. U ovom dijelu priče može vam se učiniti da se Cypress sastoji od dva RV770 u sitnijem pakovanju, no razlike postoje čak i na najmanjoj logičkoj jedinici. Stream jezgrama su dodane nove hardverske instrukcije, a ubrzano je i izvršavanje nekih instrukcija.
Na nivou SIMD blokova kapacitet lokalne dijeljene memorije je povećan na 32KB, a izmijenjene su i teksturne jedinice. Interpolacija se više ne vrši u ovom dijelu jer je taj dio posla u sklopu implementacije DirectX 11 pull-model interpolacije prebačen na stream jezgre. S obzirom da shaderi ovaj posao obavljaju mnogo brže, Cypress je na tom polju daleko efikasniji od RV770. S obzirom da Cypress ima duplo više SIMD jedinica od prethodnika, potrebno je osigurati podatke za obradu, pa je i kapacitet L2 cachea povećan sa 64KB kod RV770 na 128KB po svakom od četiri bloka. Propusnost prema L1 cacheu je tako porasla na 435GB/s, dok je u slučaju RV770 propusnost na relaciji L2-L1 bila 384GB/s.
Jedan od pojmova koji se često spominje kada se govori o novinama implementiranim u Cypress je Sum of Absolute Differences ili SAD instrukcija. U slučajevima kada SAD instrukcija nije hardverski prisutna, emulira se kroz 12 ili više posebnih instrukcija, dok hardverski implementirani SAD izvršava instrukciju u jednom ciklusu. S obzirom da SAD instrukcija nije dio DirectX 11 implementacije, DirectX aplikacije neće moći direktno pozvati izvršenje instrukcije, no sam kompajler može pozvati izvršenje instrukcije, što može ubrzati izvršavanje SAD instrukcije bez obzira da li sam program može pozvati izvršavanje ove instrukcije.
Baš kao i ostatak ključnih tehnologija čije se su mogućnosti proširene, i broj ROP-ova (raster operation processing) je povećan, pa za razliku od RV770 koji ima 16, Cypress ima 32 ROP-a. Osim povećanja u brojnosti, ROP jedinice su također doživjele neke promjene. ATI se vratio supesampling antialiasingu, no tome ćemo nešto više kasnije. Memorijski kontroler, kao i kod RV770, čine četiri 64-bitna kontrolera, pa je širina sabirnice ukupno 256 bita. AMD je u ovom slučaju više pažnje posvetio samoj memoriji, odnosno dostizanju viših radnih taktova.
S obzirom da je sabirnica ograničavajući faktor, kada su u pitanju ultra visoki radni taktovi GDDR5 memorija, AMD je uveo EDC (Error Detection Codes), što je u osnovi sistem CRC provjera na svakom transferu podataka. U slučaju da CRC otkrije grešku, memorijski kontroler zahtijeva ponovljeni prijenos, što se u osnovi ponavlja sve dok informacija ne bude prenesena u potpunosti i neoštećena. Za razliku od ranije prakse kada bi se maksimalan radni takt utvrđivao s pojavom grešaka u prikazu, s ovim sistemom situacija je nešto drugačija. S obzirom da će greške biti ispravljane, u praksi će biti omogućeno dostizanje viših radnih taktova, no uslijed retransmisije podataka koja će se odvijati s pojavom grešaka, može se očekivati negativan utjecaj na performanse. Za prosječnog overclockera ovo u biti znači da maksimalan overclock više neće utvrđivati pojavom artefakata, nego padom performansi, što će zahtijevati nešto više vremena.
Još jedna novina je Memory Clock Temperature Compensation, odnosno kompenzacija temperature. Naime, zbog visokih radnih taktova, GDDR5 čipovi su u ovom slučaju izuzetno osjetljivi na visoke temperature. Spomenuta funkcija vrši nadzor te u situaciji kada se pojavi izraženo zagrijavanje, prilagođava link kako bi se izbjegle greške.
Mnogi će se prisjetiti da su prvi detalji vezani za Evergreen seriju grafičkih kartica objavljeni još početkom juna, kada su objavljene i prve informacije o DirectX 11 API-u. Sa zvaničnim predstavljanjem nove generacije grafičkih kartica, AMD je tržištu ponudio dva modela: ATI Radeon HD 5850 i ATI Radeon HD 5870. Naknadno su predstavljene i ATI Radeon HD 5770 grafičke kartice, namijenjene srednjem tržišnom segmentu, a o čemu ste već imali prilike čitati na našim stranicama.
![]() | |
Poučeni uspjehom prethodnih generacija grafičkih kartica, u AMD-u su odlučili slijediti istu poslovnu strategiju, pa su napravili grafički procesor pozicioniran tako da zadovolji potrebe srednjeg i višeg tržišnog segmenta. Kada je u pitanju apsolutni high-end tržišni segment, AMD će kao i ranije ponuditi grafičku karticu sa dva grafička čipa.
|
Grafičke kartice pod kodnim imenom Hemlock, već su najavljene, i na tržištu bi se trebale pojaviti do kraja tekuće godine. U nižim tržišnim segmentima, AMD će predstaviti grafičke kartice kodnog imena Redwood i Cedar, bazirane na istoj mikroarhitekturi, s kojima će se početkom sljedeće godine, DirectX 11 podrška obezbjediti i u entry tržišnom segmentu.
Arhitektura
Iako se radi o potpuno novom grafičkom procesoru, Cypress na nivou mikroarhitekture dijeli brojne zajedničke karakteristike sa grafičkim procesorima iz RV700 porodice. Cypress jezgra ima površinu od 334mm², što je znatno više od 260mm², kolika je površina RV770 jezgra korištenog na Radeon HD 4870 grafičkima karticama. Zahvaljujući 40nm proizvodnom procesu, na površini od 334mm² raspoređeno je 2.15 milijardi tranzistora, dok za usporedbu, RV770 ima tek 956 miliona tranzistora. Veća jezgra za sobom povlači i višu cijenu, pa su preporučene cijene za Cypress 5850 i 5870 grafičke kartice 379USD i 259USD.
| |
Cypress predstavlja svojevrsnu nadogradnju RV770 arhitekture, pa je za razumijevanje Cypress arhitekture i načina na koji ovaj čip radi potrebno osnovno poznavanje RV770 arhitekture, a zbog čega vam preporučujemo da pročitate neku od stariji recenzija grafičkih kartica iz prethodne generacije. Osnovu ove arhitekture čini stream ili thread procesor, koji je ujedno i najmanja jedinica sposobna za izvršavanje instrukcije. Stream procesor (thread procesor) se sastoji od pet stream jezgri, registra i algoritma za predviđanje. Jedna od stream jezgri je nešto naprednija od ostalih, te je sposobna za izvršavanje transcedentalnih funkcija.
| |
Stream procesori se u grupama po šesnaest jedinica dalje skupa s jedinicama za teksturisanje, L1 cache mamorijom, dijeljenom memorijom i kontrolnom logikom grupiraju u SIMD blokove (Single Instruction, Multiple Dana). SIMD blok dakle sadrži 80 stream jezgri. RV770 ima deset ovakvih SIMD blokova, dok Cypress ima dvije grupe po deset SIMD blokova, što na kraju rezultira brojkom od čak 1600 stream jezgri ili shadera. Svakom SIMD jezgru dodijeljene su četiri teksturne jedinice, što znači da ih je ukupno 80. U ovom dijelu priče može vam se učiniti da se Cypress sastoji od dva RV770 u sitnijem pakovanju, no razlike postoje čak i na najmanjoj logičkoj jedinici. Stream jezgrama su dodane nove hardverske instrukcije, a ubrzano je i izvršavanje nekih instrukcija.
| |
Na nivou SIMD blokova kapacitet lokalne dijeljene memorije je povećan na 32KB, a izmijenjene su i teksturne jedinice. Interpolacija se više ne vrši u ovom dijelu jer je taj dio posla u sklopu implementacije DirectX 11 pull-model interpolacije prebačen na stream jezgre. S obzirom da shaderi ovaj posao obavljaju mnogo brže, Cypress je na tom polju daleko efikasniji od RV770. S obzirom da Cypress ima duplo više SIMD jedinica od prethodnika, potrebno je osigurati podatke za obradu, pa je i kapacitet L2 cachea povećan sa 64KB kod RV770 na 128KB po svakom od četiri bloka. Propusnost prema L1 cacheu je tako porasla na 435GB/s, dok je u slučaju RV770 propusnost na relaciji L2-L1 bila 384GB/s.
| |
Jedan od pojmova koji se često spominje kada se govori o novinama implementiranim u Cypress je Sum of Absolute Differences ili SAD instrukcija. U slučajevima kada SAD instrukcija nije hardverski prisutna, emulira se kroz 12 ili više posebnih instrukcija, dok hardverski implementirani SAD izvršava instrukciju u jednom ciklusu. S obzirom da SAD instrukcija nije dio DirectX 11 implementacije, DirectX aplikacije neće moći direktno pozvati izvršenje instrukcije, no sam kompajler može pozvati izvršenje instrukcije, što može ubrzati izvršavanje SAD instrukcije bez obzira da li sam program može pozvati izvršavanje ove instrukcije.
| |
Baš kao i ostatak ključnih tehnologija čije se su mogućnosti proširene, i broj ROP-ova (raster operation processing) je povećan, pa za razliku od RV770 koji ima 16, Cypress ima 32 ROP-a. Osim povećanja u brojnosti, ROP jedinice su također doživjele neke promjene. ATI se vratio supesampling antialiasingu, no tome ćemo nešto više kasnije. Memorijski kontroler, kao i kod RV770, čine četiri 64-bitna kontrolera, pa je širina sabirnice ukupno 256 bita. AMD je u ovom slučaju više pažnje posvetio samoj memoriji, odnosno dostizanju viših radnih taktova.
| |
S obzirom da je sabirnica ograničavajući faktor, kada su u pitanju ultra visoki radni taktovi GDDR5 memorija, AMD je uveo EDC (Error Detection Codes), što je u osnovi sistem CRC provjera na svakom transferu podataka. U slučaju da CRC otkrije grešku, memorijski kontroler zahtijeva ponovljeni prijenos, što se u osnovi ponavlja sve dok informacija ne bude prenesena u potpunosti i neoštećena. Za razliku od ranije prakse kada bi se maksimalan radni takt utvrđivao s pojavom grešaka u prikazu, s ovim sistemom situacija je nešto drugačija. S obzirom da će greške biti ispravljane, u praksi će biti omogućeno dostizanje viših radnih taktova, no uslijed retransmisije podataka koja će se odvijati s pojavom grešaka, može se očekivati negativan utjecaj na performanse. Za prosječnog overclockera ovo u biti znači da maksimalan overclock više neće utvrđivati pojavom artefakata, nego padom performansi, što će zahtijevati nešto više vremena.
Još jedna novina je Memory Clock Temperature Compensation, odnosno kompenzacija temperature. Naime, zbog visokih radnih taktova, GDDR5 čipovi su u ovom slučaju izuzetno osjetljivi na visoke temperature. Spomenuta funkcija vrši nadzor te u situaciji kada se pojavi izraženo zagrijavanje, prilagođava link kako bi se izbjegle greške.





















Komentari (0)