Spesifikasi Rodion 7800. Keluarga Kartu Grafis AMD Radeon

Nama kode chip: "Tahiti"
4,3 miliar transistor (lebih dari 60% lebih banyak dari Cayman dan persis dua kali lebih banyak dari Cypress)
Bus memori 384-bit: enam pengontrol lebar 64-bit dengan dukungan memori GDDR5
Jam inti: hingga 925 MHz (untuk Radeon HD 7970)
32 Unit Komputasi GCN dengan 128 inti SIMD dengan total 2048 ALU floating point (format Integer dan Float, dukungan presisi IEEE 754 FP32 dan FP64)
128 unit tekstur, dengan dukungan untuk penyaringan trilinear dan anisotropik untuk semua format tekstur
32 ROP dengan dukungan untuk mode anti-aliasing dengan kemungkinan pengambilan sampel yang dapat diprogram lebih dari 16 sampel per piksel, termasuk dengan format framebuffer FP16 atau FP32. Performa puncak hingga 32 sampel per jam, dan dalam mode tanpa warna (khusus Z) - 128 sampel per jam
Dukungan terintegrasi untuk enam monitor termasuk HDMI 1.4a dan DisplayPort 1.2

Spesifikasi Grafik Radeon HD 7970

Jam inti: 925 MHz
Jumlah prosesor universal: 2048
Jumlah unit tekstur: 128, unit campuran: 32
Frekuensi memori efektif: 5500 MHz (4×1375 MHz)
Jenis memori: GDDR5
Kapasitas memori: 3 gigabyte
Bandwidth memori: 264 gigabyte per detik
Tingkat pengisian maksimum teoretis: 29,6 gigapiksel per detik.
Laju pengambilan sampel tekstur teoretis: 118,4 gigatexel per detik
Dua konektor CrossFire
Ban PCI Express 3.0
Konsumsi daya: 3 hingga 250 W
Satu konektor daya 8-pin dan satu konektor daya 6-pin
Desain slot ganda
MSRP AS: $549

Spesifikasi Grafik Radeon HD 7950

Frekuensi inti: 800 MHz
Jumlah prosesor universal: 1792
Jumlah unit tekstur: 112, unit campuran: 32
Frekuensi memori efektif: 5000 MHz (4×1250 MHz)
Jenis memori: GDDR5
Kapasitas memori: 3 gigabyte
Bandwidth memori: 240 gigabyte per detik
Rasio pengisian maksimum teoretis: 25,6 gigapiksel per detik.
Laju pengambilan sampel tekstur teoretis: 89,6 gigatexel per detik
Dua konektor CrossFire
Bus PCI Express 3.0
Konektor: DVI Dual Link, HDMI 1.4, dua Mini-DisplayPort 1.2
Konsumsi daya: 3 hingga 200 W
Desain slot ganda
MSRP AS: $449

Kompleksitas tinggi dari chip baru ini menarik perhatian - 4,3 miliar transistor, yang lebih dari setengah jumlah transistor pada prosesor grafis kelas atas sebelumnya. Kemampuan untuk membuat kristal yang begitu rumit dimungkinkan dengan penggunaan teknologi proses 28 nanometer modern, dan chip baru ternyata memiliki luas yang sedikit lebih kecil daripada ukuran Cayman. Dan karakteristik praktisnya yang memengaruhi kinerja telah ditingkatkan secara nyata: jumlah ALU, TMU, bus memori. Hanya jumlah ROP yang tidak bertambah, dan frekuensi memori video GDDR5 tetap pada level yang sama.

Prinsip penamaan kartu video perusahaan tetap sama. Radeon HD 7970 adalah solusi chip tunggal paling produktif dari perusahaan, setelah beberapa waktu model HD 7950 yang lebih muda dirilis, yang diumumkan beberapa saat kemudian. Awalnya, HD 7970 tidak memiliki pesaing di pasar dan tidak mengganti kartu video tertentu dari lini AMD, melainkan menurunkannya. Untuk perbandingan dengan pesaingnya, NVIDIA merilis solusi 28nm jauh kemudian.

Memori GDDR5 yang sama dipasang pada kartu video AMD yang baru, tetapi volumenya, bukannya 2 gigabyte pada generasi sebelumnya, telah berkembang menjadi 3 gigabyte. Ini terjadi karena perluasan bus memori dari 256-bit menjadi 384-bit. Dan sekarang Anda dapat menempatkan 1,5 GB atau 3 GB di papan baru. Secara alami, dari sudut pandang pemasaran, memasang volume yang lebih kecil akan menjadi kerugian yang jelas, jadi keputusan dibuat untuk memasang 3 GB, meskipun hari ini terlalu banyak. Hanya dalam resolusi sangat tinggi dan dengan MSAA 16x 1,5-2 GB tidak akan cukup. Namun, AMD juga memiliki Eyefinity, dan untuk game di tiga monitor atau lebih, buffer layar hanya akan memakan jumlah yang sangat besar.

Jadi, mari kita lihat Radeon HD 7970. Kartu video baru dari kisaran harga atas ini memiliki sistem pendingin dua slot, yang dilapisi dengan casing plastik, yang akrab bagi semua motherboard AMD modern, di sepanjang panjangnya. dari kartu. Hanya desain selubung ini yang sedikit berubah, meskipun bagian belakangnya masih melampaui PCB. Tetapi desain palang dengan pin telah diubah - untuk meningkatkan pendinginan kartu video, salah satu dari dua slot (setengah palang) ditempati secara eksklusif oleh lubang ventilasi untuk pembuangan panas.

Tetapi pengguna tidak boleh menderita karena pengurangan jumlah konektor DVI yang disolder langsung di papan. Untuk kenyamanan mereka, adaptor HDMI-DVI khusus akan disertakan dalam paket, yang memungkinkan Anda menghubungkan dua monitor dengan konektor DVI. Ngomong-ngomong, konsumsi daya kartu baru ini tidak lebih rendah dari Radeon HD 6970, jadi harus memasang satu set konektor daya 8-pin dan satu konektor daya 6-pin.

Tapi di Radeon baru HD 7970 telah mengubah sistem pendinginnya menjadi lebih baik. Ruang evaporator generasi baru dan pendingin baru yang lebih besar digunakan, dengan bentuk bilah yang dimodifikasi dan kinerja yang ditingkatkan (aliran udara yang lebih besar disediakan). Hasilnya adalah peningkatan efisiensi pendingin sekaligus mengurangi kebisingan.

Sakelar juga tidak hilang dari papan. Firmware Ganda BIOS, yang kami tulis dalam deskripsi Radeon HD 6900. Singkatnya: kartu video memiliki dua versi BIOS, satu dengan kemungkinan flashing khusus, dan yang kedua dengan firmware bawaan di pabrik. Baik pengguna maupun AMD sangat menyukai solusi praktis ini sehingga AMD memutuskan untuk terus melengkapi solusi top-end dengannya.

Kami hanya dapat menyambut solusi ini, yang sangat membantu dalam berbagai kasus yang terkait dengan masalah tak terduga selama flashing (kematian listrik dalam proses, misalnya), dan memungkinkan Anda untuk melakukan berbagai eksperimen dengan gambar BIOS tanpa rasa takut. Tidak mengherankan, AMD berulang kali mengisyaratkan kemampuan overclocking yang luar biasa dari kartu grafis baru:

Seperti yang Anda lihat, overclocking ke frekuensi 1 GHz dan lebih tinggi secara praktis dijanjikan, jika Anda tidak memperhitungkan tulisan kecil (yang tidak termasuk dalam tangkapan layar) bahwa jaminan berhenti berlaku meskipun kartu video gagal seperti hasil percobaan dengan menaikkan frekuensi dari driver video pengaturan.

Fitur arsitektur Radeon HD 7970

Untuk menilai relevansi modifikasi arsitektural di Kepulauan Selatan, pertama-tama pertimbangkan perkembangan GPU selama beberapa tahun terakhir dalam pandangan AMD. Hingga tahun 2002, chip grafis adalah spesifik Perangkat keras mampu murni komputasi grafis. Chip video pada waktu itu memiliki fungsi terbatas, mereka hanya dapat menerapkan dan memfilter tekstur, memproses geometri, terlibat dalam rasterisasi primitif, dan oleh karena itu sama sekali tidak cocok untuk tugas komputasi universal.

Selama beberapa tahun berikutnya, programabilitas dasar ditambahkan ke GPU, tetapi juga berfokus secara eksklusif pada tugas grafis. Ini adalah waktu dukungan untuk DirectX 8 dan 9, program shader fungsionalitas terbatas dengan kemampuan floating point. Chip video pada waktu itu memiliki ALU khusus untuk pemrosesan simpul dan piksel, serta cache khusus untuk piksel, tekstur, dan data lainnya. Universalitas bahkan masih belum dekat.

Dan baru pada tahun 2007, AMD mendapatkan arsitektur shader terpadu DirectX 10, serta kemampuan memprogram GPU menggunakan alat khusus: CAL, Brook, ATI Stream. GPU saat itu sudah memiliki caching lanjutan dan dukungan untuk data bersama lokal dan global. Secara arsitektural, chip tersebut didasarkan pada blok VLIW5 dan VLIW4, cukup fleksibel untuk beberapa komputasi non-grafis dasar, tetapi tetap berfokus pada algoritme grafis.

Dan sekarang saatnya untuk arsitektur baru, bahkan lebih cocok untuk komputasi universal - Inti Grafis Berikutnya (GCN). Bagi AMD, ini adalah era arsitektur baru, itulah mengapa nama itu dipilih. GPU baru menawarkan kemampuan dan kinerja pemrosesan grafik yang luar biasa, tetapi perubahan arsitektural yang dibuat dimaksudkan terutama untuk meningkatkan posisi dalam komputasi non-grafis - meningkatkan kinerja dan efisiensi dalam tugas tujuan umum yang kompleks. Desain GPU baru dirancang untuk apa yang disebut komputasi heterogen - campuran grafik dan tujuan umum dalam lingkungan multitugas. Arsitektur GCN telah menjadi lebih fleksibel dan seharusnya lebih cocok untuk pelaksanaan berbagai tugas yang hemat energi.

Blok dasar dalam arsitektur baru adalah blok GCN. Di atas "batu bata" inilah semua GPU baru dari seri Kepulauan Selatan didasarkan. Arsitektur untuk pertama kalinya chip grafis AMD menggunakan desain non-VLIW, menggunakan blok vektor dan skalar, dan salah satu yang paling perubahan penting menjadi bahwa setiap unit komputasi GCN memiliki penjadwalnya sendiri dan dapat menjalankan instruksi dari berbagai program (kernel).

Arsitektur komputasi baru dirancang untuk memuat unit komputasi dengan efisiensi tinggi dalam lingkungan multitugas. Unit komputasi GCN dibagi menjadi empat subbagian, yang masing-masing bekerja pada aliran instruksinya sendiri setiap siklus clock. Utas juga dapat menggunakan blok skalar yang ditemukan di GCN untuk kontrol aliran atau operasi penunjuk. Kombinasi blok vektor dan skalar menawarkan model pemrograman yang sangat sederhana. Misalnya, penunjuk fungsi dan penunjuk tumpukan jauh lebih mudah untuk diprogram, dan tugas kompiler sekarang sangat disederhanakan, karena unit eksekusi adalah skalar.

Setiap blok GCN memiliki penyimpanan data lokal 64 KB khusus untuk pertukaran data atau ekstensi tumpukan lokal untuk register. Selain itu, blok tersebut menyertakan memori cache tingkat pertama dengan kemampuan membaca dan menulis, dan pipeline tekstur lengkap (blok pengambilan sampel dan pemfilteran). Oleh karena itu, unit komputasi baru dapat bekerja secara mandiri, tanpa penjadwal pusat, yang pada arsitektur sebelumnya bertanggung jawab untuk mendistribusikan pekerjaan antar blok. Sekarang masing-masing blok GCN mampu menjadwalkan dan mendistribusikan perintah sendiri, satu unit komputasi dapat mengeksekusi hingga 32 aliran perintah yang berbeda, yang dapat berasal dari ruang alamat virtual yang berbeda di memori dan sepenuhnya terlindungi dan tidak bergantung satu sama lain.

Arsitektur GPU AMD sebelumnya menggunakan model arsitektur VLIW4 dan VLIW5, dan meskipun cukup baik untuk tugas grafis, mereka tidak cukup efisien untuk komputasi tujuan umum, karena sangat sulit untuk memuat semua unit eksekusi dengan pekerjaan dalam kondisi seperti itu. Arsitektur GCN baru menawarkan sejumlah besar unit eksekusi yang serupa, tetapi dalam eksekusi skalar yang menghilangkan batasan dan ketergantungan register dan instruksi. Transisi dari arsitektur VLIW ke eksekusi skalar memberikan penyederhanaan tugas pengoptimalan kode yang nyata.

Saat menjalankan instruksi pada arsitektur VLIW4 sebelumnya, kompiler harus berurusan dengan resolusi konflik register, distribusi instruksi yang kompleks ke unit eksekusi pada tahap kompilasi kode, dll. Pada saat yang sama, untuk mencapai kinerja tinggi, pengoptimalan non-sepele sering dilakukan diperlukan, yang cocok untuk sebagian besar tugas grafis dan kurang fleksibel untuk kalkulasi lainnya. Arsitektur baru menawarkan penyederhanaan pengembangan dan dukungan yang signifikan, pembuatan yang disederhanakan, analisis dan menangkap kesalahan dalam kode tingkat rendah, kinerja yang stabil dan dapat diprediksi.

Subsistem caching memori

Bandwidth dan memori dan cache tidak pernah cukup, dan selalu ada kebutuhan dan metode untuk meningkatkannya. GPU baru AMD menggunakan cache baca/tulis dua tingkat penuh. Setiap unit komputasi memiliki 16 kilobyte cache tingkat pertama, dan total volume cache tingkat kedua adalah 768 kilobyte (total, chip mendapatkan 512 KB L1 dan 768 KB L2), yang 50% lebih banyak dari pada chip sebelumnya , yang tidak memiliki kemampuan untuk menulis sama sekali ke cache L2.

Dari segi kinerja, setiap unit komputasi GCN dapat menerima atau menulis 64 byte data dari / ke cache L1 atau memori global dalam satu siklus, yang berfungsi untuk bertukar data antar aliran perintah. Jumlah data yang sama mampu mengirim dan menerima setiap bagian dari memori cache L2. Hasilnya, GPU kelas atas perusahaan mencapai 2 terabyte / dtk untuk L1 dan 700 GB / dtk untuk L2, yang 50% lebih tinggi dari solusi AMD teratas sebelumnya.

GPU Tahiti

Sekarang setelah kita melihat perubahan arsitektural tingkat rendah pada seri Kepulauan Selatan yang baru, saatnya beralih ke detail solusi lini yang paling canggih, Radeon HD 7900, yang mencakup dua model. Pertama-tama, mari kita perhatikan kompleksitas besar dari GPU baru, karena ini mencakup lebih dari 4,3 miliar transistor, yang dua kali lipat dari chip yang menjadi dasar Radeon HD 5870! Secara alami, chip yang begitu kuat menjadi mungkin hanya berkat penggunaan teknologi proses 28 nm yang baru. Jadi apa yang dia miliki di dalam?

Jumlah blok geometris tidak berubah, dibandingkan dengan Cayman, masih ada dua, tetapi efisiensi kerjanya telah meningkat secara signifikan - kita akan membahasnya lebih detail nanti. Pada diagram prosesor grafis, kami melihat 32 unit komputasi arsitektur GCN tersedia di Radeon HD 7970, dan dalam kasus solusi junior, beberapa di antaranya akan dinonaktifkan. Jika kami mempertimbangkan kinerja komputasi puncak dari solusi tersebut, maka hampir 3,8 teraflops (jumlah operasi floating point per detik), yang merupakan rekor mutlak untuk GPU saat ini.

Setiap blok GCN memiliki 16 unit tekstur, yang memberikan angka total 128 TMU per chip, atau lebih dari 118 gigatexel / detik - dan ini adalah rekor lain pada saat rilis, dan ini bukan yang terakhir. Namun jumlah blok ROP tidak berubah, masih ada 32 di 8 blok RBE yang diperbesar. Perubahan arsitektur lain yang menarik adalah bahwa sekarang blok ROP "dipasang" bukan ke saluran memori, seperti sebelumnya, tetapi ke blok GCN.

Meskipun kecepatan tulis framebuffer teoretis tidak banyak berubah, dan kemungkinan maksimum adalah 32 nilai warna yang sama dan nilai kedalaman 128 per jam, tingkat pengisian praktis (tingkat pengisian) dalam aplikasi nyata telah meningkat secara signifikan karena peningkatan bandwidth memori. AMD mengukur Cayman hanya pada 23 piksel per jam, sedangkan Tahiti baru mendekati 32 piksel per jam teoretis.

Ini bisa dimaklumi, karena chip video AMD yang baru memiliki bus memori 384-bit - enam saluran 64-bit, seperti solusi pesaing kelas atas saat ini. Peningkatan 1,5 kali lipat dalam bandwidth memori inilah yang memungkinkan untuk meningkatkan kecepatan aktual pengambilan tekstur dan penulisan ke framebuffer. Bandwidth 264 GB / s seharusnya membantu mendekati angka teoretis 118 gigatexel / detik dan 30 gigapiksel / detik, dan di bagian praktis kami akan memeriksanya.

Dalam kasus prosesor grafis Radeon HD 7950 yang "dipreteli", Tahiti menyertakan 28 unit komputasi aktif dari arsitektur GCN dari 32 unit yang tersedia secara fisik pada chip. Dalam kasus solusi junior dari seri Radeon HD 7970, diputuskan untuk menonaktifkan empat di antaranya. Karena setiap GCN memiliki 16 unit tekstur, angka TMU total untuk model baru adalah 112 TMU, yang menghasilkan throughput hampir 90 gigatexel/dtk.

Tetapi jumlah ROP dan pengontrol memori di HD 7950 tidak berubah, mereka memutuskan untuk tidak memotongnya dan mempertahankan masing-masing 32 dan 6 buah yang sama. Oleh karena itu, chip video Tahiti Pro memiliki bus memori 384-bit yang sama, yang dirangkai dari enam saluran 64-bit, sebagai solusi teratas AMD. Rupanya, itu adalah perangkat fungsional komputasi yang paling menderita dari pernikahan selama produksi, dan mereka memutuskan untuk tidak menghentikan yang lainnya.

Tessellation dan Pemrosesan Geometri

Dari sudut pandang arsitektural, tidak ada yang istimewa yang berubah di blok geometris Tahiti sejak Cayman. Itu masih menggunakan dua blok untuk memproses (mengatur simpul dan tessellation) data geometris dan rasterisasi, dan skemanya sangat mirip dengan yang kita lihat sebelumnya, kecuali bahwa tessellator sudah disebut generasi ke-9:

Terlepas dari kesamaan skema, generasi terbaru dari blok ini mampu melakukan tesselasi dan kinerja pemrosesan geometri yang jauh lebih baik, karena blok tersebut telah mengalami modifikasi yang signifikan. Meskipun kinerja puncak hanya meningkat menjadi hampir dua miliar simpul dan primitif per detik (925 MHz dan dua simpul per jam), kinerja sebenarnya meningkat lebih banyak. Ini dicapai dengan meningkatkan ukuran cache, meningkatkan buffering data geometri, dan menggunakan kembali data vertex.

Hasilnya, kinerja tesselasi ditingkatkan pada semua rasio pemisahan segitiga hingga empat kali lipat dibandingkan Radeon HD 6970 generasi sebelumnya. Tetapi empat kali tidak tercapai dalam semua kasus, bahkan pada diagram dari AMD sendiri:

Bagan tersebut menunjukkan perbandingan performa tessellation Radeon HD 7970 dibandingkan dengan HD 6970 pada rasio split dari 1 hingga 32. Dan seperti yang Anda lihat, perbedaan performanya adalah dari 1,7 hingga 4 kali lipat. Tapi ini sintetis telanjang. Dan untuk lebih mendekati kenyataan, kami akan memberikan lebih banyak data tentang kecepatan tesselasi yang sudah ada di aplikasi game:

Seperti yang Anda lihat, nomor sintetis AMD didukung dengan baik oleh nomor game - kinerja dalam aplikasi nyata dengan tessellation "berat" telah tumbuh secara signifikan. Ini adalah hasil yang sangat bagus, yang pasti akan kami periksa di bagian praktis, menggunakan contoh aplikasi sintetik dan game.

Perhitungan non-grafis

Dari sudut pandang tugas komputasi heterogen dan non-grafis, dua mesin komputasi asinkron (Asynchronous Compute Engines - ACE) telah muncul. Mereka dirancang untuk menjadwalkan dan mendistribusikan pekerjaan antara unit eksekusi untuk multitasking yang efisien dan bekerja bersama dengan prosesor perintah grafis (Command Processor).

Radeon HD 7900 memiliki dua mesin komputasi independen dan satu mesin grafis. Secara total, ini memberikan tiga blok yang dapat diprogram dan tiga aliran instruksi, sepenuhnya terpisah satu sama lain. Dan selain mengeluarkan perintah secara asinkron untuk pengalihan konteks cepat, GPU baru ini juga dilengkapi dua pengontrol akses memori langsung (DMA) dua arah yang diperkenalkan di Cayman. Kedua pengontrol ini diperlukan untuk memanfaatkan sepenuhnya bus PCI Express 3.0 yang baru.

Seperti yang kita ketahui, dari sudut pandang perhitungan yang serius, tidak hanya kecepatan melakukan operasi floating point dengan presisi tunggal, tetapi juga presisi ganda (floating point presisi ganda) itu penting. Dan arsitektur baru AMD melakukan pekerjaan yang cukup bagus untuk itu. Saat ini, diasumsikan bahwa ada dua versi unit komputasi GCN dengan kecepatan eksekusi yang berbeda untuk instruksi FP64. Untuk GPU yang lebih tua, kecepatan eksekusi adalah 1/4 dari kecepatan FP32, dan untuk chip yang lebih muda, kecepatan eksekusi adalah 1/16, yang cukup untuk menjaga kompatibilitas, tetapi tidak terlalu mempersulit solusi murah. Hasilnya, Radeon HD 7970 mampu melakukan 947 miliar operasi presisi ganda per detik (oh, mereka baru saja mencapai teraflop!) - ada pencapaian tertinggi lainnya dari chip AMD yang baru.

Selain itu, ini bukan gigaflop yang sama seperti arsitektur sebelumnya, tetapi lebih "gemuk". Toh, efektivitas GPU baru itu kompleks tugas komputasi harus meningkat secara signifikan. Pertama, subsistem memori dan caching telah diperbaiki. Kedua, setiap unit komputasi GCN memiliki penjadwalnya sendiri, yang akan meningkatkan eksekusi kode percabangan dan efisiensi secara keseluruhan. Dan ketiga, kami mencatat eksekusi skalar, yang tidak memerlukan pengoptimalan kompleks dari kompiler, akibatnya unit komputasi akan lebih jarang menganggur. Dan sebagai hasilnya, dalam tugas apa pun, chip baru akan lebih mudah menunjukkan kinerja tinggi dan memuat ALU.

Di antara inovasi lain yang terkait dengan kemampuan komputasi, kami mencatat kelengkapannya dukungan ECC untuk DRAM dan SRAM. Di sisi perangkat lunak, penting bahwa Tahiti adalah GPU pertama dengan dukungan penuh untuk versi API baru: OpenCL 1.2, DirectCompute 11.1 dan C++ AMP serta kemampuannya. Misalnya, OpenCL 1.2 memungkinkan Anda menggabungkan kemampuan beberapa perangkat komputasi menjadi satu, dan AMD telah merilis dukungan untuk ini dalam bentuk AMD APP SDK 2.6 dan driver Catalyst 11.12.

Kinerja Arsitektur dan Efisiensi

Setelah meninjau semua inovasi arsitektur pada contoh chip teratas dari seri Southern Island, saatnya berbicara tentang keefektifan semua perubahan ini. Jelas bahwa kinerja chip baru jauh lebih tinggi daripada yang sebelumnya, sebaliknya akan sangat mengejutkan. Pertanyaannya adalah seberapa cepat. Dalam berbagai tugas, angka diperoleh dari 40-50% (minimal!) Hingga selisih lima kali lipat. Perbaikan dalam arsitektur memungkinkan untuk melampaui perbedaan teoretis 1,4 kali lipat dalam gigaflop bodoh. Mari kita lihat ini dengan contoh:

Diagram tersebut membandingkan solusi top baru dan solusi chip tunggal sebelumnya: Radeon HD 7970 dan HD 6970, yang cukup adil. Berbagai tes kinerja dipilih: SmallptGPU dan LuxMark adalah ray tracing pada OpenCL, SHA256 adalah algoritme hashing yang aman, dan AES256 adalah algoritme enkripsi simetris. Nah, Mandelbrot adalah masalah terkenal yang dihitung dengan perhitungan presisi ganda.

Garis putus-putus vertikal pada grafik menunjukkan perbedaan teoretis dalam performa, tetapi data kecepatan menunjukkan bahwa dalam tiga dari lima tugas, kecepatan GPU baru jauh lebih tinggi. Ini karena semua perubahan yang ditujukan untuk meningkatkan efisiensi: menjauh dari VLIW, kehadiran penjadwal di setiap unit komputasi, peningkatan caching, dll.

Perubahan dalam kualitas rendering

Sebenarnya, bagian ini bisa saja dilewati, karena akhir-akhir ini tidak ada klaim khusus untuk kualitas gambar dan tidak bisa - karena berbagai alasan. Misalnya, kualitas anti-aliasing layar penuh untuk kartu video produsen yang berbeda sangat dekat, terutama mengingat distribusi luas metode anti-aliasing perangkat lunak menggunakan filter pasca-pemrosesan, yang dilakukan pada semua GPU dengan cara yang persis sama.

Hal yang sama berlaku untuk pemfilteran tekstur - sekarang kualitasnya sedemikian rupa sehingga sangat sulit untuk membedakan antara solusi AMD dan NVIDIA bahkan jika Anda melakukan perbandingan piksel demi piksel. Radeon HD 6900 - generasi perusahaan sebelumnya - telah sedikit lebih meningkatkan penyaringan anisotropik, dan sekarang bahkan "mikroskop" tidak akan membantu menemukan kekurangan yang signifikan di sana. Satu-satunya catatan adalah bahwa kartu video Radeon yang bergerak sedikit lebih rendah daripada GeForce karena artefak spesifik yang lebih mencolok, seperti "noise" atau "sand".

Dengan dirilisnya chip video generasi baru, bobot texel pada filter tekstur direvisi sekali lagi, dimodifikasi sedemikian rupa untuk mengurangi artefak tersebut, terkadang terlihat pada Radeon HD 6900 dengan adanya tekstur jenis tertentu ("frekuensi tinggi", dengan transisi tajam dari gelap ke terang, misalnya). Perubahan kualitas sangat sulit untuk ditunjukkan dengan contoh bahwa AMD tidak memberikan gambar perbandingan HD 7900 versus HD 6900, tetapi hanya membandingkan kualitas algoritme "perangkat keras" dengan algoritme perangkat lunak murni yang berjalan pada prosesor aliran GPU, dan karenanya ideal :

Pada tangkapan layar sekecil itu, perbedaan kualitas tidak terlihat, tetapi AMD memastikan bahwa semua perubahan yang dilakukan tidak menyebabkan penurunan kinerja dan tidak memperburuk kualitas gambar di salah satu aspek - tetap tidak bergantung pada sudut dan kualitas penyaringan mendekati ideal. Di salah satu materi praktis yang akan datang, kami pasti akan memeriksanya.

Tekstur Residen Sebagian

Gagasan Partially Resident Textures (PRT) adalah untuk menggunakan kemampuan perangkat keras dari GPU yang disajikan - memori virtual. Tentunya banyak pengguna telah melihat game RAGE dari id Software, yang menggunakan teknologi tekstur virtual, yang disebut megatexturing ("MegaTexture"), yang menyediakan kemampuan untuk menggunakan data tekstur dalam jumlah besar dan menukar (streaming) ke dalam memori video.

Menggunakan memori video virtual, sangat mudah untuk mendapatkan dukungan perangkat keras yang efektif untuk algoritme semacam itu, yang memungkinkan penggunaan tekstur hingga 32 terabyte dalam aplikasi, yang memungkinkan untuk membuat lokasi unik dalam game, tanpa mengulangi potongan tekstur, tanpa masalah dengan memuat data tekstur. Benar, contoh ilustratif AMD terlalu aneh, yang darinya tidak ada yang jelas:

PRT memungkinkan Anda mencapai kualitas gambar yang tinggi dan membantu meningkatkan efisiensi penggunaan memori video. Algoritme serupa sudah digunakan di mesin Perangkat Lunak id, dan diharapkan muncul di banyak mesin generasi berikutnya. Game masa depan perlu bekerja dengan data dalam jumlah besar, dan keuntungan dari GPU baru ini adalah memori grafis lokal dalam algoritme PRT berfungsi seperti memori cache perangkat keras, dan tekstur dimuat ke dalamnya bila diperlukan. GPU dari keluarga Kepulauan Selatan mendukung "tekstur mega" hingga 32 terabyte (resolusi hingga 16384×16384) dan, yang terpenting, pemfilteran tekstur perangkat keras untuknya, yang tidak tersedia pada chip video sebelumnya.

Tekstur virtual dibagi menjadi potongan-potongan berukuran 64 kilobyte (kilobyte, bukan texel) dan ukuran potongan ini tetap. Dan hanya yang diperlukan saat merender bingkai saat ini yang dimuat ke dalam memori lokal kartu video. Teknologi ini berfungsi terlepas dari format teksturnya, hanya ukuran potongan dalam texel yang akan berbeda. Misalnya, untuk tekstur biasa yang tidak dikompres dengan 32 bit per warna, ukuran bongkahan akan menjadi 128x128 texel, dan untuk tekstur terkompresi DXT3 akan menjadi 256x256 texel.

Teknologi ini juga melibatkan penggunaan mip-level tekstur (salinan yang lebih kecil digunakan dalam pemfilteran tekstur). Saat merender dan memfilter, mereka perlu diakses beberapa kali. Pertimbangkan pengoperasian algoritme pada sebuah contoh.

Angka ini menyoroti empat bagian berbeda dari level mip berbeda yang diperlukan untuk rendering. Ketika program shader meminta data dari mereka, beberapa bagian sudah ada di memori lokal dan data ini segera dikirim ke shader untuk perhitungan lebih lanjut. Tetapi beberapa bagian hilang dari tabel, dan aplikasi harus memutuskan apa yang harus dilakukan selanjutnya pada kesalahan tersebut. Misalnya, Anda dapat meminta data dari mip-level dengan resolusi lebih rendah, maka gambar akan kabur, tetapi setidaknya akan terlihat seperti aslinya dan akan digambar tanpa penundaan. Dan pada saat frame berikutnya dirender, itu sudah dapat dimuat ke dalam cache - memori video lokal. Mereka yang memainkan RAGE akan mengerti kita.

Ini adalah algoritme canggih yang memungkinkan Anda menggunakan tekstur besar yang unik untuk setiap objek. Algoritme serupa telah lama digunakan dalam perenderan offline, kecuali untuk kebutuhan penghitungan waktu nyata. AMD bahkan membuat demo menggunakan teknik Per-Face Texture Mapping yang dikembangkan oleh Walt Disney Animation Studios untuk film animasi mereka. Sayangnya, demo belum siap, dan kami hanya melihat tangkapan layar beresolusi rendah.

Inti dari teknik pemetaan tekstur ini adalah untuk menetapkan potongan tekstur tertentu pada setiap poligon, tanpa perlu menggunakan transformasi UV (menemukan korespondensi antara koordinat permukaan objek tiga dimensi dan koordinat pada objek dua dimensi). tekstur dimensi). Pendekatan ini memecahkan beberapa masalah dengan membuat konten tessellated dengan membuat algoritma pemetaan perpindahan menjadi sangat sederhana. Dan PRT dalam metode ini digunakan untuk penyimpanan yang efisien dan akses ke data tekstur.

Petunjuk Penanganan Media

Inovasi yang menarik di Kepulauan Selatan tampaknya adalah dukungan untuk instruksi khusus yang digunakan dalam pemrosesan gambar, baik statis maupun dinamis. Misalnya, instruksi yang banyak digunakan disebut "jumlah perbedaan mutlak", lebih dikenal sebagai SAD (Jumlah Perbedaan Mutlak), telah diperbaiki. Kecepatan pelaksanaannya merupakan hambatan yang sangat penting bagi kinerja di banyak algoritme pemrosesan data gambar dan video, seperti deteksi gerakan, pengenalan gerakan, pencarian gambar, visi komputer, dan banyak lainnya.

Namun dalam ulasan kami tentang kartu video lama Radeon HD 5870, kami telah menulis tentang dukungan SAD. Sekarang, selain SAD biasa (4 × 1), Kepulauan Selatan punya instruksi baru- QSAD (quadruple SAD), yang menggabungkan SAD dengan operator shift untuk meningkatkan kinerja dan efisiensi daya, serta instruksi "topeng" MQSAD, yang mengabaikan piksel latar belakang dan digunakan untuk mengisolasi objek yang bergerak dalam bingkai dari latar belakang.

GPU baru dapat memproses hingga 256 piksel per unit komputasi GCN per jam, dalam kasus model ini AMD Radeon HD 7970 berarti kemampuan memproses hingga 7,6 triliun piksel per detik dalam hal nilai warna bilangan bulat 8-bit. Meskipun ini adalah angka teoretis, kemampuan pemrosesan visual dari GPU baru cukup mengesankan - banyak tugas pemrosesan video dapat dilakukan secara real time.

PCI Express 3.0

Kami tidak dapat mengabaikan dukungan PCI Express versi ketiga dengan seluruh lini solusi grafis baru dari Kepulauan Selatan. Dukungan ini cukup diharapkan, karena spesifikasi PCI Express versi ketiga akhirnya disetujui pada musim gugur 2010, tetapi masih belum ada solusi perangkat keras dengan dukungannya, meskipun motherboard sudah muncul, kartu video dirilis pada akhir tahun. 2011, dan prosesor pusat yang sesuai Ada.

Antarmuka yang diperbarui memiliki kecepatan transfer 8 gigatransaksi per detik, bukan 5 GT / dtk untuk versi 2.0, dan bandwidthnya sekali lagi berlipat ganda (hingga 32 Gb / dtk) dibandingkan dengan standar PCI Express 2.0. Bus baru menggunakan skema pengkodean yang berbeda untuk data yang dikirim melalui bus, tetapi kompatibilitas dengan versi PCI Express sebelumnya tetap dipertahankan.

Motherboard pertama dengan dukungan PCI Express 3.0 diperkenalkan pada musim panas 2011, terutama berdasarkan chipset Intel Z68, dan muncul di pasar umum hanya pada musim gugur di tahun yang sama. Jadi kartu video tiba tepat waktu, dan AMD kembali menjadi yang terdepan dalam hal kecepatan rilis prosesor grafis baru dengan dukungan untuk teknologi paling canggih. Namun masih terlalu dini untuk menilai apakah PCI-E 3.0 akan berguna secara praktis.

Teknologi AMD PowerTune

Salah satu inovasi paling menarik di Cayman adalah teknologi manajemen daya canggih PowerTune. Manajemen daya GPU yang fleksibel telah digunakan sejak lama, tetapi sebelum Radeon HD 6900, semua teknologi ini agak primitif dan sebagian besar metode perangkat lunak dan mengubah frekuensi dan voltase secara bertahap, tidak dapat mematikan sebagian besar chip video .

Bahkan dalam keluarga Radeon HD 5000, pembatas kinerja muncul ketika tingkat konsumsi tertentu terlampaui, dan di Radeon HD 6900 sistem berpindah ke tingkat yang berbeda secara kualitatif. Untuk melakukan ini, sensor khusus dimasukkan ke dalam chip di semua blok yang memantau parameter boot. GPU secara konstan mengukur beban dan konsumsi daya dan tidak membiarkan yang terakhir melampaui ambang batas tertentu, secara otomatis menyesuaikan frekuensi dan voltase sehingga parameter tetap berada dalam paket termal yang ditentukan.

Tidak seperti teknologi manajemen daya awal, PowerTune memberikan kontrol langsung atas konsumsi daya GPU, berlawanan dengan kontrol tidak langsung dengan mengubah frekuensi dan voltase. Teknologi ini membantu menyetel frekuensi GPU tinggi, mendapatkan performa tinggi dalam game, dan tidak takut konsumsi dapat melampaui batas aman. Lagi pula, sebagian besar game dan aplikasi reguler yang menggunakan komputasi GPU memiliki kebutuhan daya yang jauh lebih rendah dan tidak mendekati batas konsumsi daya yang berbahaya, tidak seperti uji stabilitas seperti Furmark dan OCCT.

Bahkan game terberat pun tidak memerlukan konsumsi daya maksimum, dan jika Anda membatasi konsumsi berdasarkan frekuensi, menguji kartu video dengan pengujian ekstrem, maka dalam kasus game 3D, akan ada cukup banyak peluang kinerja dan daya yang tidak terpakai. Jika kartu video belum mencapai batas tingkat konsumsi aman, GPU akan beroperasi pada frekuensi yang ditetapkan di pabrik, dan dalam pengujian FurMark dan OCCT, frekuensi GPU akan berkurang agar tetap berada dalam batas konsumsi.

Dengan demikian, PowerTune membantu menyetel frekuensi pabrik yang lebih tinggi dan menyetel sistem untuk penggunaan sumber daya GPU yang paling efisien pada set level daya maksimum. Pada contoh yang ditunjukkan di atas, HD 5870 tidak menggunakan PowerTune dan karena pembatasan frekuensi GPU konsumsi tinggi dalam uji ketahanan tidak menggunakan potensi penuhnya. Sementara TDP maksimum ditetapkan untuk Radeon HD 7970, dan chip video menyetel ulang frekuensi hanya jika terlampaui, mendapatkan kinerja setinggi mungkin dalam aplikasi apa pun.

Ini jelas ditunjukkan dalam diagram berikut. Dalam hal aplikasi game, TDP dapat dicapai dengan meningkatkan frekuensi GPU, dan untuk beban puncak, uji ketahanan mengurangi frekuensi ke tingkat konsumsi daya yang aman. Tanpa PowerTune, Anda harus memilih - baik untuk mendapatkan kemungkinan kegagalan kartu video saat FurMark dan OCCT berjalan lama, atau untuk mengurangi potensi kinerja dalam game. Teknologi baru mengatasi masalah ini dengan cara yang paling efisien.

AMD PowerTune menghadirkan respons cepat terhadap perubahan kondisi (mikrodetik) karena merupakan teknologi perangkat keras. Ini juga dibedakan dengan penyetelan frekuensi yang fleksibel, dan tidak berundak, seperti pada chip sebelumnya. Semua pengukuran tidak bergantung pada driver, tetapi dapat disesuaikan oleh pengguna menggunakan pengaturan kartu video.

Perbedaan antara PowerTune dan pendekatan yang diterima secara umum sebelumnya adalah bahwa dalam kasus lain, pelambatan termal digunakan, yang menempatkan GPU dalam mode konsumsi yang berkurang secara signifikan, dan PowerTune dengan mulus mengurangi frekuensinya, membawa konsumsi GPU ke batas yang ditetapkan. Ini menghasilkan kecepatan clock yang lebih tinggi dan kinerja yang lebih tinggi.

Teknologi AMD ZeroCore

AMD tidak membatasi diri untuk menggunakan teknologi manajemen daya yang sudah dikenal dari solusi sebelumnya. Pada chip pertama dari keluarga Southern Islands, ini memperkenalkan teknologi AMD ZeroCore, yang membantu mencapai efisiensi energi yang lebih besar dalam mode "deep idle" (atau "sleep") dengan perangkat layar yang dinonaktifkan, yang didukung oleh semua sistem operasi .

Lagi pula, hampir semua sistem, bahkan sistem game, menghabiskan sebagian besar waktunya dalam mode beban rendah pada prosesor grafis. Dan kartu video seharusnya tidak menghabiskan banyak daya dalam mode ini. Dan terlebih lagi, belum lagi mode dengan monitor dimatikan - dalam hal ini, disarankan untuk mematikan GPU sama sekali. Itulah yang dilakukan AMD. Berkat ZeroCore, GPU baru ini mengonsumsi kurang dari 5% daya dalam mode penuh saat dalam mode diam, menonaktifkan sebagian besar blok fungsional dalam mode ini.

AMD memberikan perbandingan skematik dengan Radeon HD 5870 miliknya sendiri, yang tidak mendukung teknologi ini. ZeroCore adalah inovasi eksklusif Kepulauan Selatan dalam solusi desktop dari GPU seluler yang dirancang untuk laptop. Omong-omong, keunggulan teknologi ini tidak hanya terkait dengan pengurangan konsumsi. Selain itu, dalam mode siaga lama, saat tampilan dimatikan, kartu video juga mematikan kipas pada pendingin kartu video sepenuhnya!

Inilah yang telah lama ditunggu-tunggu oleh banyak pengguna. Hal yang paling menarik adalah menurut data kami, pengujian laboratorium terhadap solusi seperti PowerTune dan ZeroCore dilakukan beberapa generasi kartu video yang lalu. Beberapa sampel teknik kartu video dari seri AMD yang telah lama keluar dari pasar bekerja persis seperti ini, mematikan pendingin sepenuhnya dalam waktu idle.

Namun bukan hanya pengguna GPU tunggal yang mendapat manfaat dari pengurangan kebisingan dan konsumsi daya dengan kartu grafis berkemampuan ZeroCore AMD yang baru. Peningkatan serupa menunggu pemilik sistem CrossFire yang bahagia berdasarkan dua, tiga, dan bahkan empat GPU. Apakah logis, bagaimanapun, bahwa dalam mode rendering antarmuka dua dimensi dari sistem operasi, semua kartu video, kecuali yang utama, tidak boleh berfungsi sama sekali? Tapi begitulah cara mereka bekerja sekarang!

Dalam kasus sistem CrossFire pada kartu video dengan dukungan ZeroCore dalam mode 2D, semua kartu video sekunder dibenamkan dalam mode tidur nyenyak dengan konsumsi daya minimal dan pendingin yang dinonaktifkan. Mode ini berfungsi baik untuk beberapa kartu video chip tunggal dan untuk solusi dua chip. Selain itu, kartu grafis CrossFire utama juga akan memasuki mode ini jika terjadi waktu idle yang lama yang dikonfigurasi di Windows. Secara visual, perbedaan pekerjaan terlihat seperti ini:

Omong-omong, teknologinya tidak sesederhana kelihatannya. Insinyur AMD harus menyelesaikan banyak masalah terkait pengoperasian sistem operasi dalam mode siaga. Misalnya, mereka menemukan bahwa Windows mencoba memperbarui informasi di layar bahkan saat monitor dimatikan. Yang tentunya tidak memungkinkan Anda untuk menonaktifkan GPU sama sekali. Oleh karena itu, pemrogram perusahaan harus mengambil solusi, mengabaikan semua perintah menggambar layar saat monitor dimatikan dalam mode tidur.

Teknologi AMD Eyefinity 2.0

Secara alami, dalam arsitektur baru ada tempat untuk peningkatan teknologi yang telah terbukti untuk menampilkan gambar pada banyak monitor - AMD Eyefinity, sekarang dalam versi 2.0. Ini telah menerima fitur baru, resolusi lebih tinggi, dukungan untuk lebih banyak tampilan dan peningkatan fleksibilitas.

Teknologi ini cukup menarik, meski sejumlah kecil pengguna akan menemukan ruang di dalam ruangan dan mengumpulkan keberanian di depan keluarga untuk memasang lebih dari dua monitor. Tetapi lebih baik memiliki kesempatan untuk selalu dapat menggunakannya daripada tidak memilikinya sama sekali. Selain itu, harga monitor diagonal besar hampir tidak turun, tetapi solusi kelas menengah terus menjadi lebih murah.

Memang, sekarang lebih menguntungkan membeli tiga monitor dengan diagonal layar 24″ daripada satu monitor 30 inci. AMD memberikan contoh seperti itu, di mana monitor 30″ 2560x1600 berharga lebih dari $1.000, sementara tiga monitor 24″ FullHD dapat dibeli dengan setengah harga:

Tetapi bagaimana membelanjakan uang dan ruang Anda di kamar adalah masalah pribadi setiap pengguna. Yang utama adalah ada peluang seperti itu. Plus, Eyefinity 2.0 sekarang mendukung output gambar dalam mode stereo HD3D - sesuatu yang kurang dalam solusi sebelumnya, yang lebih rendah daripada solusi pesaing dalam parameter ini. Menggabungkan teknologi AMD Eyefinity dan HD3D, Radeon HD 7970 adalah solusi chip tunggal pertama yang mendukung tiga monitor dalam mode stereo.

Render stereo resolusi tinggi membutuhkan antarmuka transfer data yang sangat cepat. Dan dengan keluaran HDMI versi sebelumnya, kemungkinannya dibatasi hingga 24Hz per mata, yang hanya cukup untuk menonton film Blu-ray 3D, tetapi jelas tidak cukup untuk para gamer.

Untuk tugas seperti itu, mereka mulai menggunakan format pengepakan bingkai, ketika bingkai untuk mata kiri dan kanan digabungkan menjadi satu, dan AMD Radeon HD 7970 mendukung format pengepakan bingkai HDMI 1.4a untuk output stereo. Ini adalah kartu video pertama yang mendukung HDMI 3 GHz dengan kemasan bingkai, di mana setiap mata memiliki gambar FullHD pada 60 Hz (total 120 Hz):

Kebaruan lain yang menarik bagi kami tampaknya adalah teknologi output suara multi-saluran Discrete Digital Multi-Point Audio (DDMA), yang bekerja sama dengan Eyefinity. Semua GPU sebelumnya mampu mengeluarkan melalui HDMI dan DisplayPort hanya satu aliran audio. Artinya, meskipun tiga monitor yang terletak di ruangan berbeda dihubungkan ke PC melalui HDMI, hanya satu saluran audio yang ditransmisikan. Tetapi AMD Radeon HD 7900 menerima dukungan untuk keluaran simultan dari beberapa saluran audio independen sekaligus, yang mungkin berguna dalam beberapa konfigurasi multi-monitor.

Fitur yang sama akan sangat berguna untuk aplikasi konferensi video dengan menampilkan beberapa lawan bicara di layar terpisah, serta aplikasi multitasking seperti bermain di tiga monitor dengan audio game dan menonton berita di layar terpisah dengan aliran audio independen. Sebelumnya, untuk semua ini perlu menggunakan beberapa sistem audio terpisah, tetapi sekarang semuanya berfungsi senyaman mungkin.

Dukungan software Eyefinity juga tidak dilupakan, hampir setiap bulan teknologinya diperbarui - peluang baru muncul. Jadi, pada bulan Oktober, dukungan untuk resolusi hingga 16384 × 16384 dan konfigurasi multi-monitor baru muncul: horizontal dan vertikal 5 × 1, serta berdasarkan enam monitor dalam mode 3 × 2.

Pembaruan driver video AMD Catalyst pada bulan Desember membawa Eyefinity dan HD3D untuk bekerja sama, dan pada bulan Februari, dukungan untuk resolusi khusus, penyesuaian penempatan bilah tugas, dan peningkatan manajemen prasetel diumumkan.

Keluaran ke enam monitor dapat dicapai dengan menggunakan dua port DisplayPort 1.2 dan dua hub MST (yang telah kami tulis sebelumnya), sementara tiga atau bahkan empat monitor hanya memerlukan satu port dan hub yang sesuai. Hub ini menawarkan konfigurasi tampilan yang fleksibel, mendukung hingga empat perangkat FullHD per konektor DisplayPort 1.2, dan akan tersedia pada musim panas 2012.

Berbicara tentang izin. Resolusi tinggi atau bahkan sangat tinggi - Resolusi Ultra Tinggi. Perangkat saat ini dengan resolusi 4000 piksel di sisi yang lebih besar memerlukan koneksi menggunakan beberapa kabel sekaligus: dua DP 1.1 atau empat DVI. Monitor dengan resolusi generasi berikutnya ini akan terhubung hanya menggunakan satu kabel: DP 1.2 HBR2 atau HDMI 1.4a 3 GHz. DAN kartu video baru AMD sudah siap untuk monitor semacam itu, lagi-lagi menjadi yang pertama di dunia.

Encoding dan decoding video

Sangat wajar jika AMD Radeon HD 7970 menyertakan blok UVD yang sama untuk mendekode data video, yang muncul di chip video perusahaan generasi sebelumnya. Itu tidak memerlukan modifikasi apa pun, mendukung codec multi-aliran MVC, decoding MPEG-2/MPEG-4 (DivX), VC-1 dan H.264, serta mendekode dua aliran FullHD dalam semua format yang didukung.

Solusi AMD memberikan decoding aliran video kualitas tertinggi, menggunakan beberapa lusinan algoritme peningkatan kualitas khusus dan memberikan hasil maksimal dalam pengujian kualitas seperti HQV. Di antara fitur yang didukung, kami perhatikan: penyesuaian warna dan nada, pengurangan noise, penajaman, penskalaan berkualitas tinggi, kontras dinamis, deinterlacing lanjutan, dan telecine terbalik. Berikut adalah contoh peningkatan kontras on-the-fly:

Tetapi dengan decoding, semua chip video kurang lebih telah dipesan untuk waktu yang lama. Semua GPU baru memberikan kualitas dan kinerja yang layak saat melihat data video. Namun penyandian video pada GPU masih dalam tahap awal, dan keluhan utama dari pengguna diarahkan pada rendahnya kualitas gambar terkompresi yang dihasilkan.

Mungkin seri Radeon HD 7000 baru dapat membantu dalam hal ini, karena semua prosesor grafis dalam seri ini memiliki unit penyandian video Video Codec Engine (VCE). Radeon HD 7970 adalah kartu video pertama yang mendukung pengkodean yang dipercepat perangkat keras dan kompresi video menggunakan blok khusus (sebelumnya, prosesor aliran mengambil bagian dalam pengkodean).

Kualitas dan kinerja harus jelas lebih baik dari sebelumnya, dengan dukungan untuk pengkodean 1080p pada 60fps, bahkan lebih cepat dari waktu nyata. Sulit untuk mengatakan apa pun tentang kualitas tanpa pengujian, tetapi kami dijanjikan tingkat pengoptimalan pembuat enkode yang berbeda untuk data video dan game, serta kualitas kompresi variabel (kemampuan untuk memilih antara meningkatkan kualitas atau kinerja).

Sejauh ini, tidak ada tempat untuk mencoba VCE - tidak ada aplikasi yang mendukungnya, tetapi AMD bekerja sama dengan mitra seperti ArcSoft untuk menyediakan dukungan VCE dalam produk perangkat lunak yang sesuai. Di masa mendatang, kami berencana untuk merilis pustaka perangkat lunak untuk mempercepat penyandian video, yang akan memudahkan pengembang untuk mendukung produk AMD generasi mendatang.

Pengodean dapat dilakukan dalam dua mode: penuh dan hibrid (menggunakan kemampuan prosesor aliran GPU). Mode penuh dirancang untuk aplikasi yang memerlukan efisiensi energi maksimum dan tingkat performa yang konsisten. Pengkodean mode penuh pada VCE lebih cepat dari waktu nyata dan memberikan latensi rendah. Tetapi ada juga mode hybrid:

Dalam mode ini, blok matematika GPU bekerja sama dengan VCE. Semua tahapan yang sangat dapat diparalelkan, yang dilingkari dengan warna kuning pada diagram, dapat menggunakan kekuatan unit komputasi GCN, dan unit VCE khusus terlibat dalam pengkodean entropi perangkat keras yang efisien. Mode ini sangat cocok untuk kartu video dengan kekuatan matematika yang hebat, seperti Radeon HD 7970. Masih ada pertanyaan tentang kualitas kedua mode ini, tetapi ini memerlukan analisis menyeluruh dalam materi terpisah.

Video Stabil AMD

Selain encoding dan decoding data video, ada area lain di mana kekuatan grafis baru AMD dapat digunakan - meningkatkan video genggam berkualitas buruk tanpa menggunakan tripod atau alat stabilisasi gambar serupa lainnya. Teknologi stabilisasi video disebut AMD Steady Video, dan versi keduanya telah dirilis.

Algoritme penstabil perangkat lunak cukup sederhana: berdasarkan aliran video, statistik tentang pergerakan kamera (pergeseran, rotasi, zoom) dikumpulkan dan gerakan ini dikompensasi dalam bingkai saat ini, relatif terhadap yang sebelumnya - gambar digeser, diputar dan diskalakan agar gambar tidak banyak melompat dan tetap stabil.

Sesederhana dalam kata-kata, sama sulitnya untuk diterapkan. Hanya karena ada dua juta piksel di layar, dan hingga 30 atau bahkan 60 bingkai per detik Bayangkan berapa banyak kalkulasi yang perlu Anda lakukan untuk melacak semua kemungkinan pergeseran bingkai. Kami telah menulis di atas tentang fungsi QSAD yang digunakan dalam pemrosesan video, dan juga digunakan dalam Steady Video 2.0 untuk mempercepat algoritme deteksi gerakan. Jadi GPU harus memproses pergeseran acak dengan amplitudo hingga 32 piksel ke segala arah, dan ini membutuhkan kinerja yang setara dengan lebih dari 500 miliar operasi SAD per detik (untuk 1920x1080 pada 60 FPS).

Dengan mendukung instruksi QSAD baru di Radeon HD 7970, keunggulannya dibandingkan CPU bertenaga dalam algoritme deteksi gerakan melebihi 10x! Artinya, video berkualitas tinggi sekarang akan diberikan kepada kami, dan tidak hanya saat memproses video rumahan di editor video, tetapi juga saat menonton video online orang lain, yang direkam oleh tidak ada yang tahu apa dan tidak ada yang tahu caranya.

Detail: Seri Radeon HD 7800

Nama kode chip: "Pitcairn"
Teknologi produksi: 28 nm
2,8 miliar transistor (sedikit lebih banyak dari Cayman, yang merupakan dasar dari seri Radeon HD 6900)
Arsitektur terpadu dengan array prosesor bersama untuk pemrosesan aliran berbagai jenis data: simpul, piksel, dll.
Dukungan perangkat keras untuk DirectX 11.1, termasuk model shader Shader Model 5.0
Bus memori 256-bit: empat pengontrol lebar 64-bit dengan dukungan memori GDDR5
Jam inti: hingga 1000 MHz (untuk Radeon HD 7870)
20 Unit Komputasi GCN dengan 80 inti SIMD untuk total 1280 ALU floating point (format Integer dan Float, dukungan presisi IEEE 754 FP32 dan FP64)
80 unit tekstur, dengan dukungan untuk penyaringan trilinear dan anisotropik untuk semua format tekstur
32 ROP dengan dukungan untuk mode anti-aliasing dengan kemungkinan pengambilan sampel yang dapat diprogram lebih dari 16 sampel per piksel, termasuk dengan format framebuffer FP16 atau FP32. Performa puncak hingga 32 sampel per jam, dan dalam mode tanpa warna (khusus Z) - 128 sampel per jam

Spesifikasi Grafik Radeon HD 7870

Frekuensi inti: 1000 MHz
Jumlah prosesor universal: 1280
Jumlah unit tekstur: 80, unit pencampuran: 32
Jenis memori: GDDR5
Kapasitas memori: 2 gigabyte
Rasio pengisian maksimum teoretis: 32,0 gigapiksel per detik.
Laju pengambilan sampel tekstur teoretis: 80,0 gigatexel per detik.
Satu konektor CrossFire
Bus PCI Express 3.0
Konektor: DVI Dual Link, HDMI 1.4, dua Mini-DisplayPort 1.2
Konsumsi daya: 3 hingga 175 W
Dua konektor daya 6-pin
Desain slot ganda
MSRP AS: $349

Spesifikasi Grafik Radeon HD 7850

Frekuensi inti: 860 MHz
Jumlah prosesor universal: 1024
Jumlah unit tekstur: 64, unit pencampuran: 32
Frekuensi memori efektif: 4800 MHz (4×1200 MHz)
Jenis memori: GDDR5
Kapasitas memori: 2 gigabyte
Bandwidth memori: 153,6 gigabyte per detik
Tingkat pengisian maksimum teoretis: 27,5 gigapiksel per detik.
Laju pengambilan sampel tekstur teoretis: 55,0 gigatexel per detik.
Satu konektor CrossFire
Bus PCI Express 3.0
Konektor: DVI Dual Link, HDMI 1.4, dua Mini-DisplayPort 1.2
Konsumsi daya: 3 hingga 130 W
Desain slot ganda
MSRP AS: $249

Dan kali ini, prinsip penamaan produk perusahaan tidak diubah dan tren seri sebelumnya dilanjutkan. Seri kartu video anggaran menengah berdasarkan arsitektur GCN berbeda dari garis atas dan anggaran pada digit kedua dalam indeks: alih-alih 7 dan 9, angka 8 ditetapkan, yang cukup logis. Karena AMD telah mengambil ambang psikologis 1000 MHz untuk frekuensi GPU, Radeon HD 7870 menerima penambahan "Edisi GHz" pada namanya, yang menunjukkan adopsi frekuensi ini.

Dari namanya jelas bahwa Radeon HD 7800 lebih produktif daripada HD 7700, tetapi memiliki kecepatan yang lebih rendah dibandingkan model lama - HD 7900. Untuk perbandingan dengan solusi NVIDIA, HD 7870 yang lebih lama dirilis pada saat rilis bersaing dengan kartu video GeForce GTX 570, dan yang lebih muda ditujukan untuk melawan GTX 560 Ti, dan NVIDIA belum merilis chip kelas menengah 28 nm yang baru.

Kedua model kartu video dari AMD memiliki memori GDDR5 dengan jumlah yang sama yaitu 2 gigabyte. Keduanya menggunakan bus memori 256-bit, sehingga Anda dapat memasukkan 1, 2, atau 4 GB ke dalamnya. 1 gigabyte terlalu kecil, dan 4 GB terlalu mahal untuk segmen harga ini. Oleh karena itu, kami dapat mengatakan bahwa jumlah memori video 2 GB yang ideal telah dipilih, yang cukup memadai untuk sebagian besar game bahkan pada resolusi tinggi, dan tidak terlalu mahal dalam hal biaya.

Di sisi lain, dari segi konsumen, model HD 7850 dan HD 7870 masih berbeda. Radeon HD 7870 yang lebih tua memiliki konsumsi daya yang lebih tinggi, sehingga membutuhkan dua konektor daya 6-pin tambahan, dan HD 7850 hanya berisi satu dari mereka. Kedua papan memiliki desain sistem pendingin dua slot, tetapi sebagian besar pabrikan memproduksi papan dengan desain mereka sendiri setidaknya pendingin, dan bahkan PCB.

Fitur arsitektur dari keluarga Radeon HD 7800

Di atas, kami telah menjelaskan dengan cermat semua fitur arsitektur Graphics Core Next (GCN) baru, jadi kami hanya akan mengulangi yang paling penting. Semua GPU baru perusahaan menawarkan fitur dan kinerja luar biasa tidak hanya dalam pemrosesan grafik, tetapi juga dalam komputasi non-grafis, termasuk campuran berbagai jenis kalkulasi. Selain itu, arsitektur GCN yang baru menawarkan penyederhanaan tugas pengoptimalan kode yang serius, penyederhanaan pengembangan dan dukungan, serta kinerja yang stabil dan dapat diprediksi, dan, secara umum, efisiensi yang cukup tinggi.

Blok dasar dari arsitektur baru adalah blok GCN, dan semua GPU dari seri Kepulauan Selatan dirakit darinya. Pertimbangkan diagram blok chip Pitcairn:

Diagram menunjukkan GPU Radeon HD 7870 (HD 7850 yang "disederhanakan" berbeda darinya dengan beberapa blok yang terputus), kami melihat 20 unit komputasi dari arsitektur GCN. Dalam kasus solusi junior dari seri Radeon HD 7800, empat di antaranya dinonaktifkan, dan jumlah blok aktif di dalamnya adalah 16. Ini masing-masing sesuai dengan prosesor aliran 1280 dan 1024 (seperti dalam kasus HD 7700 keluarga, hanya ada dua kali lebih banyak blok) . Karena setiap unit GCN memiliki empat unit tekstur, jumlah TMU untuk model lama adalah 80 TMU, dan untuk yang lebih muda - 64 TMU.

Namun jumlah ROP dan pengontrol memori di HD 7870 dan HD 7850 juga sama dengan solusi di lini termuda. Jumlah blok ROP dibiarkan cukup tinggi - 32 buah untuk kedua model. Bus memori untuk papan berdasarkan Pitcairn telah dipotong menjadi 256-bit, dirangkai dari empat saluran 64-bit. Ini tidak buruk untuk solusi level ini, meskipun satu setengah kali lebih sedikit daripada di baris teratas, karena bus memori secara tradisional ditebang terlebih dahulu. Ada baiknya penggunaan memori GDDR5 yang cepat memberikan bandwidth yang relatif tinggi yaitu 153 GB / s.

Seperti chip arsitektur GCN lainnya, Pitcairn menggabungkan blok tesselator generasi ke-9, menampilkan banyak pengoptimalan buffering dan caching, yang dapat meningkatkan kinerja pemrosesan geometri secara signifikan. Berikut adalah perbandingan papan AMD baru dengan solusi generasi sebelumnya dalam masalah sintetik, yang menurutnya kami dapat mengasumsikan peningkatan kecepatan teselasi hingga empat kali lipat:

Banyak teknologi AMD yang telah diperkenalkan dan ditingkatkan dalam chip video Radeon HD 7000 yang baru juga didukung dengan cara yang sama.Berikut daftar lengkapnya: PowerTune, ZeroCore, Eyefinity 2.0, HD3D, Steady Video, kualitas pemfilteran tekstur perbaikan, dll. Semua ini dijelaskan lebih detail di atas. Untuk menambah daftar, Radeon HD 7800 sepenuhnya mendukung algoritme anti-aliasing MLAA 2.0 yang ditingkatkan dan supersampling anti-aliasing (SSAA).

Sejauh menyangkut kinerja game, Radeon HD 7870 secara signifikan lebih cepat daripada pesaing langsungnya GeForce GTX 570, terutama mengingat VRAM 1,25 GB terakhir (dibandingkan dengan 2 GB untuk solusi yang dimaksud) yang diamati dalam game modern dengan resolusi rendering tinggi . Radeon HD 7850 yang lebih muda dapat dibandingkan dengan GeForce GTX 560 Ti, dan di sini tidak lagi membanggakan jumlah memori. Namun, menurut pengukuran AMD, solusi baru mereka ini masih lebih cepat dibandingkan kompetitor di sebagian besar game.

Detail: Seri Radeon HD 7700

Nama kode chip: "Tanjung Verde"
Teknologi produksi: 28 nm
1,5 miliar transistor (kurang dari Barts, yang menjadi dasar dari seri Radeon HD 6800)
Arsitektur terpadu dengan rangkaian prosesor umum untuk pemrosesan streaming berbagai jenis data: simpul, piksel, dan lainnya.
Dukungan perangkat keras untuk DirectX 11.1, termasuk model shader Shader Model 5.0
Jam inti: hingga 1000 MHz (untuk Radeon HD 7770)
10 Unit Komputasi GCN dengan 40 inti SIMD dengan total 640 ALU floating point (format Integer dan Float, dukungan presisi IEEE 754 FP32 dan FP64)
40 unit tekstur, dengan dukungan untuk penyaringan trilinear dan anisotropik untuk semua format tekstur
Dukungan terintegrasi hingga enam monitor termasuk HDMI 1.4a dan DisplayPort 1.2

Spesifikasi Grafik Radeon HD 7770

Frekuensi inti: 1000 MHz
Jumlah prosesor universal: 640
Jumlah unit tekstur: 40, unit campuran: 16
Jenis memori: GDDR5
Kapasitas memori: 1 gigabita
Laju pengambilan sampel tekstur teoretis: 40,0 gigatexel per detik.
Satu konektor CrossFire
Bus PCI Express 3.0
Konektor: DVI Dual Link, HDMI 1.4, dua Mini-DisplayPort 1.2
Konsumsi daya: 3 hingga 80 W
Satu konektor daya 6-pin
Desain slot ganda
MSRP AS: $159

Spesifikasi Grafik Radeon HD 7750

Frekuensi inti: 800 MHz
Jumlah prosesor universal: 512
Jumlah unit tekstur: 32, unit campuran: 16
Frekuensi memori efektif: 4500 MHz (4×1125 MHz)
Jenis memori: GDDR5
Kapasitas memori: 1 gigabita
Bandwidth memori: 72 gigabyte per detik
Tingkat pengisian maksimum teoretis: 12,8 gigapiksel per detik.
Laju pengambilan sampel tekstur teoretis: 25,6 gigatexel per detik
Bus PCI Express 3.0
Konektor: DVI Dual Link, HDMI 1.4, satu DisplayPort 1.2
Konsumsi daya: 3 hingga 55 W
Tidak membutuhkan tenaga tambahan
Desain slot tunggal
MSRP AS: $109

Seri kartu video berbiaya rendah berdasarkan arsitektur GCN berbeda dari garis atas dan tengah pada digit kedua dalam indeks: tempat ke-9 ditempati oleh angka 7, seperti sebelumnya. Radeon HD 7770 adalah solusi yang lebih produktif, tetapi ada juga model yang lebih muda - HD 7750. Papan lama tidak memiliki pesaing langsung di pasar pada saat dirilis, karena terletak di antara GeForce GTX 560 dan GTX 550 Ti , dan yang lebih muda ditujukan untuk melawan GTX 550 Ti. Untuk HD 7770, pesaing diumumkan kemudian dengan GeForce GTX 560 SE (semua solusi NVIDIA didasarkan pada GPU lama).

Kedua model kartu video AMD yang dipertimbangkan memiliki memori GDDR5 dengan jumlah yang sama yaitu 1 gigabyte. Karena penggunaan bus memori 128-bit, memori 2 GB dapat dimasukkan ke dalamnya, tetapi jumlah memori GDDR5 ini akan terlalu mahal untuk segmen harganya. Oleh karena itu, model dengan volume seperti itu telah dirilis sejauh ini, meskipun opsi dengan memori video 2 GB mungkin akan dirilis di masa mendatang. Sementara itu, kami memutuskan untuk meninggalkan volume ini untuk HD 7800.

Dalam hal karakteristik konsumen lainnya, model HD 7750 dan HD 7770 cukup berbeda. Jika Radeon HD 7770 yang lebih lama memiliki desain sistem pendingin dua slot dan pendinginnya ditutupi dengan casing plastik seperti pada solusi lama, maka HD 7750 yang lebih muda terlihat lebih sederhana, menempati satu slot dan memiliki pendingin yang sederhana. Namun, sebagian besar pabrikan masih memproduksi papan dengan desainnya sendiri. Konsumsi daya model baru dalam kisaran harga ini juga berbeda, yang lebih tua memiliki satu konektor daya tambahan 6-pin, dan yang lebih muda ditenagai oleh PCI Express.

Fitur arsitektur Radeon HD 7700

Blok dasar dari arsitektur baru adalah blok GCN, dan semua seri GPU dirakit darinya. Setiap blok GCN yang tersedia mampu menjadwalkan dan mendistribusikan instruksinya sendiri, dan satu unit komputasi dapat mengeksekusi hingga 32 aliran instruksi independen. Mari kita lihat diagram blok chip Cape Verde:

Diagram menunjukkan GPU Radeon HD 7770 (HD 7750 yang "dipreteli" menampilkan beberapa unit yang tidak terhubung), kami melihat 10 unit komputasi arsitektur GCN. Dalam kasus solusi junior dari seri Radeon HD 7700, diputuskan untuk menonaktifkan dua di antaranya, dan jumlah blok menjadi 8. Ini sesuai dengan prosesor aliran 640 dan 512. Dan karena setiap unit GCN memiliki 4 unit tekstur dalam komposisinya, angka terakhir jumlah TMU untuk model lama adalah 40 TMU, dan untuk yang lebih muda - 32 TMU.

Jumlah ROP dan pengontrol memori di HD 7770 dan HD 7750 adalah sama, dan kami memutuskan untuk tidak memotong ROP terlalu banyak, menyisakan masing-masing 16. Tetapi bus memori di Cape Verde dipotong menjadi 128-bit, yang dirangkai dari dua saluran 64-bit. Secara umum, ini tiga kali lebih sedikit daripada di seri teratas, dan kami melihat konfirmasi lain bahwa bus memori secara tradisional ditebang menjadi chip yang tidak mahal, pertama-tama. Meskipun penggunaan memori GDDR5 yang cepat memungkinkan untuk meninggalkan bandwidth yang relatif tinggi (untuk solusi murah semacam itu) sebesar 72 GB / s.

Tetap bagi kami untuk mencatat jumlah cache L2 yang agak besar - sebanyak 512 kilobyte (dibandingkan dengan 768 KB untuk chip top-end - tampaknya, cache L2 tidak memakan terlalu banyak ruang pada chip), juga sebagai perbaikan dalam kinerja geometrik. Seperti chip top-of-the-line, Cape Verde menampilkan tesselator generasi ke-9 yang menampilkan beberapa buffering dan pengoptimalan caching untuk memberikan peningkatan penting dalam kinerja pemrosesan geometri melalui seri Radeon HD 6000.

Secara umum, kami tidak akan mengulangi semua informasi tentang teknologi AMD yang telah diterapkan dan ditingkatkan dalam chip video Radeon HD 7000 yang baru (berikut sebagian daftarnya: PowerTune, ZeroCore, Eyefinity 2.0, HD3D, Steady Video, peningkatan kualitas pemfilteran tekstur , dll. .p.), semua ini dijelaskan secara lebih rinci di atas. Seri HD 7700 mendukung semua fitur yang tercantum di sana, termasuk AMD Eyefinity 2.0 dengan enam monitor dan rendering stereo, serta unit decoding dan encoding video yang ditingkatkan.

Tapi bagaimana dengan hal terpenting - performa dalam game? Perkiraan pertama kecepatan rendering selalu dapat dibuat dari presentasi pabrikan. AMD percaya bahwa Radeon HD 7770 masing-masing berada di tengah-tengah antara GeForce GTX 560 dan GeForce GTX 550 Ti, dan membandingkannya dalam bahan dengan model pesaing kedua.

Tetapi mereka tidak membandingkan Radeon HD 7750 dengan apa pun, hanya mencatat bahwa sebagian besar game modern dapat dimainkan pada model ini dengan pengaturan maksimum dalam resolusi FullHD. Namun, ini tidak mengherankan, karena dalam beberapa tahun terakhir praktis tidak ada yang eksklusif untuk PC, dan game multi-platform tidak terlalu menuntut. Jadi papan seri Radeon HD 7700 sangat cocok untuk pengguna yang ringan.

Detail: Model Radeon HD 7790

Nama kode chip: "Bonaire"
Teknologi produksi: 28 nm
2,08 miliar transistor (lebih dari Cape Verde pada Radeon HD 7700, tetapi kurang dari Pitcairn pada Radeon HD 7800)
Arsitektur terpadu dengan rangkaian prosesor umum untuk pemrosesan streaming berbagai jenis data: simpul, piksel, dan lainnya.
Dukungan perangkat keras untuk DirectX 11.1, termasuk model shader Shader Model 5.0
Bus memori 128-bit: dua pengontrol lebar 64-bit dengan dukungan memori GDDR5
Frekuensi inti: 1000 MHz
14 GCN Compute Units dari 56 SIMD Core dengan total 896 Floating Point ALU (format Integer dan Float, mendukung presisi IEEE 754 FP32 dan FP64)
56 unit tekstur, dengan dukungan untuk penyaringan trilinear dan anisotropik untuk semua format tekstur
16 ROP dengan dukungan untuk mode anti-aliasing dengan kemungkinan pengambilan sampel yang dapat diprogram lebih dari 16 sampel per piksel, termasuk dengan format framebuffer FP16 atau FP32. Performa puncak hingga 16 sampel per jam, dan dalam mode tidak berwarna (khusus Z) - 64 sampel per jam

Spesifikasi Grafik Radeon HD 7790

Frekuensi inti: 1000 MHz
Jumlah prosesor universal: 896
Jumlah unit tekstur: 56, unit pencampuran: 16
Jenis memori: GDDR5
Kapasitas memori: 1 gigabita
Bandwidth memori: 96 gigabyte per detik
Rasio pengisian maksimum teoretis: 16,0 gigapiksel per detik.
Laju pengambilan sampel tekstur teoretis: 56,0 gigatexel per detik.
Satu konektor CrossFire
Bus PCI Express 3.0
Konektor: DVI Dual Link, HDMI 1.4, dua Mini-DisplayPort 1.2
Konsumsi daya: 3 hingga 85 W
Satu konektor daya 6-pin
Desain slot ganda
MSRP AS: $149

Model kartu video murah berdasarkan chip mid-budget baru berbeda dari model top sebelumnya dari subfamili HD 7700 dengan digit ketiga dalam indeks: alih-alih 7, mereka menempatkan angka 9, yang menunjukkan peningkatan kinerja. Pada saat yang sama, indeks Radeon HD 7790 dengan jelas menunjukkan bahwa ini adalah kartu video yang kurang produktif dibandingkan dengan garis satu langkah lebih tinggi - HD 7800.

Namun, semuanya juga tidak sesederhana itu di sini - pasti akan dapat bersaing dengan HD 7850 yang lebih muda. Tetapi harga yang direkomendasikan untuk Radeon HD 7790 adalah $149, kira-kira di tengah-tengah antara harga HD 7770 dan HD 7850. Adapun solusi pesaing dari segmen harga yang sama, rilis HD 7790 adalah jelas dimaksudkan untuk bertarung dengan NVIDIA GeForce GTX 650 Ti, berdasarkan chip GK106, berada tepat di antara HD 7770 dan HD 7850 dalam hal harga dan kecepatan. Namun NVIDIA segera merespon perilisan board baru oleh AMD tersebut dengan meluncurkan versi overclock dari GeForce GTX 650 Ti Boost, yang bercirikan performa lebih tinggi.

Model kartu grafis AMD ini memiliki memori GDDR5 dengan kapasitas hanya 1 gigabyte. GPU memiliki bus memori 128-bit, dan secara teoritis 2 GB dapat disediakan, tetapi jumlah memori GDDR5 yang cepat ini masih terlalu mahal untuk segmen harga ini, dan AMD telah merilis model dengan memori yang lebih kecil, meskipun mungkin tidak demikian. cukup untuk beberapa game modern bahkan pada pengaturan dan resolusi rendah. Namun, kartu video dari mitra dengan memori video 2 GB juga dimungkinkan.

Seperti model yang berdiri di sebelahnya, Radeon HD 7790 memiliki desain sistem pendingin dual-slot, yang dilapisi dengan casing plastik. Meski sebagian besar pabrikan masih merilis papan dengan desainnya sendiri yang lebih keren, jadi referensi tidak begitu penting. Menariknya, konsumsi daya model baru ini tidak meningkat banyak dibandingkan dengan HD 7770, tetapi peningkatan efisiensi daya sudah bisa diduga. Omong-omong, itu sebabnya kebaruan juga hanya memiliki satu konektor daya tambahan 6-pin.

fitur arsitektur

GPU Bonaire baru, yang menjadi dasar Radeon HD 7790 yang dirilis, memiliki arsitektur Graphics Core Next (GCN) yang sama yang telah kami kenal selama satu setengah tahun, tetapi AMD menyebutnya GCN 1.1, mengisyaratkan perubahan kecil. Nyatanya, chip tersebut secara arsitektur hampir sama dengan yang sebelumnya, meski memang ada beberapa perubahan kecil. Misalnya, arsitektur baru memperkenalkan instruksi yang berguna untuk arsitektur heterogen (Heterogeneous System Architecture - HSA), dukungan untuk menjalankan thread secara bersamaan, serta versi baru Teknologi AMD PowerTune, yang akan kita bicarakan nanti. Tetapi semua perubahan ini tidak bisa disebut signifikan, karena tidak ada yang baru di blok dasar dan peningkatan efisiensinya.

Oleh karena itu, kami dapat merujuk dengan aman, yang menjelaskan dengan cermat semua fitur arsitektur Graphics Core Next (GCN) baru, dan di sini kami hanya akan mengulangi karakteristik dan fitur terpenting dari produk tertentu. Semua GPU terbaru AMD menawarkan fitur dan kinerja yang sangat baik dalam pemrosesan grafis dan non-grafis, termasuk campuran keduanya. Arsitektur GCN yang baru juga memberikan penyederhanaan utama dalam pengoptimalan dan tugas pengembangan perangkat lunak, dengan tetap mempertahankan efisiensi yang tinggi.

Seperti yang Anda ketahui, blok dasar arsitektur adalah blok GCN, tempat semua GPU seri Kepulauan Selatan dirakit. Unit komputasi GCN dibagi menjadi beberapa subbagian, yang masing-masing bekerja pada aliran instruksinya sendiri. Blok GCN memiliki penyimpanan data lokal 64 KB khusus untuk pertukaran data atau perluasan tumpukan register lokal. Selain itu, blok tersebut memiliki memori cache tingkat pertama dengan kemampuan membaca dan menulis serta pipa tekstur lengkap dengan blok pengambilan sampel dan pemfilteran. Setiap unit GCN yang ada mampu menjadwalkan dan mendistribusikan perintah sendiri, dan satu unit komputasi dapat menjalankan beberapa aliran instruksi independen. Mari kita lihat diagram blok dari chip baru:

Skema Bonaire menegaskan tujuan dari solusi baru untuk menawarkan performa antara Cape Verde, yang memiliki 10 unit komputasi GCN, dan Pitcairn, yang memiliki 20 unit GCN. Kedua GPU ini, dirilis pada tahun 2012, berbeda satu sama lain hampir setengahnya, jadi ada celah kinerja yang agak besar di antara keduanya, yang sekarang diisi oleh Bonaire.

Diagram menunjukkan prosesor grafis dalam bentuk Radeon HD 7790, yang merupakan solusi lengkap tanpa memotong blok apa pun. Chip tersebut mencakup 14 unit komputasi arsitektur GCN, yang setara dengan 896 pemroses aliran. Karena setiap GCN memiliki 4 unit tekstur, jumlah total TMU untuk model baru adalah 56 TMU. Artinya, Bonaire tepat 1,4 kali lebih cepat dari chip Cape Verde dalam hal kecepatan kalkulasi matematis dan pengambilan tekstur, asalkan frekuensinya sama.

Tetapi jumlah unit ROP dan pengontrol memori di Bonaire dan Radeon HD 7790 mirip dengan yang kami lihat di Cape Verde dan Radeon HD 7770 - diputuskan untuk meninggalkan 16 unit ROP, dan bus memori dari chip baru adalah 128-bit , dirakit dari dua saluran 64-bit. Jumlah ROP yang kecil dapat menjadi "tumit Achilles" dari solusi, karena penggunaan memori GDDR5 yang cepat memungkinkan untuk memberikan throughput yang relatif tinggi sebesar 96 GB / dtk, tetapi tidak ada yang dapat dilakukan terkait kinerja ROP.

Namun di GPU baru ada peningkatan kinerja geometrik dan kecepatan tesselasi. Ya, Cape Verde juga memiliki tesselator generasi ke-9, tetapi Bonaire juga menggandakan jumlah blok geometri, rasterizer, dan prosesor perintah (ditunjukkan sebagai ACE dalam diagram) - sekarang ada dua di antaranya. Peningkatan ini memberi Bonaire kemampuan untuk memproses hingga dua primitif geometris per jam - seperti halnya Pitcairn dan Tahiti yang lebih bertenaga.

Seperti yang Anda ingat, di Radeon HD 7770 AMD pertama kali mengambil ambang psikologis penting dari frekuensi jam GPU, sama dengan 1 GHz. Jadi, HD 7790 juga memiliki frekuensi referensi yang sama persis yaitu 1 GHz, sehingga peningkatan performa dibandingkan dengan HD 7770 hanya akan dibenarkan oleh perubahan arsitektural dan peningkatan jumlah unit eksekusi.

Tetapi frekuensi memori video kebaruan jauh lebih tinggi. Jika HD 7770 memiliki frekuensi memori yang relatif rendah yaitu 4,5 GHz, maka HD 7790 dilengkapi dengan memori GDDR5 cepat yang beroperasi pada 6 GHz, yang menyediakan bandwidth sepertiga lebih banyak. Peningkatan bandwidth memori video sebesar 33% dibandingkan dengan sub-keluarga Radeon HD 7700 menghasilkan peningkatan kinerja game yang jelas. AMD memberikan bagan ini, membandingkan kecepatan bingkai HD 7790 dengan memori yang berjalan pada 4,5 dan 6,0 GHz:

Percepatan maksimum dari peningkatan bandwidth memori dicapai dalam game seperti StarCraft II dan Crysis 2. Dan rata-rata, peningkatan bandwidth memori sebesar 33% menghasilkan sekitar 10% peningkatan frekuensi gambar rata-rata dalam satu set game modern. Bukan indikator yang buruk, menunjukkan bahwa bandwidth memori cukup penting di zaman kita, meski bukan satu-satunya penekanan pada kinerja. Meskipun sangat mungkin dengan lebih banyak ROP, kecepatan Bonaire akan lebih tinggi...

Jelas bahwa konsumsi daya rata-rata sedikit meningkat dibandingkan dengan HD 7770. Jika untuk model lama nilainya 80 W, maka untuk HD 7790 adalah 85 W - ini adalah harga yang sangat kecil untuk membayar peningkatan kinerja teoretis sebesar 33-40%! Peningkatan arsitektur (PowerTune), desain GPU baru berdasarkan pengalaman yang sebelumnya, serta peningkatan berkelanjutan dari proses teknis di TSMC - semua ini menyebabkan sedikit peningkatan konsumsi dengan peningkatan karakteristik kecepatan yang signifikan.

Mengenai luas chip dan jumlah transistor di Bonaire, chip baru ini jelas lebih besar dari Cape Verde, tetapi penambahan unit komputasi, tekstur, dan geometris tidak dapat luput dari perhatian. Menurut parameter ini, Bonaire juga terletak kira-kira di tengah antara Tanjung Verde dan Pitcairn. Bonaire berisi 2,08 miliar transistor dalam chip 160 mm 2, untuk Cape Verde angka ini masing-masing adalah 1,5 miliar dan 123 mm 2 , dan untuk Pitcairn - 2,8 miliar transistor dan area chip 212 mm 2.

Secara alami, chip baru ini mendukung semua teknologi AMD yang telah diperkenalkan dan ditingkatkan dalam keluarga Radeon HD 7000 baru (daftar mereka yang tidak lengkap: PowerTune, ZeroCore, Eyefinity, HD3D, Steady Video, peningkatan kualitas pemfilteran tekstur, dll.), keduanya semua ini dijelaskan secara rinci dalam artikel AMD Radeon HD 7970: Pemimpin prosesor tunggal baru. Model HD 7790 mendukung semua fitur yang tercantum di sana, termasuk AMD Eyefinity 2.0 dengan enam monitor dan rendering stereo, dan juga memiliki unit decoding dan encoding video yang ditingkatkan.

Teknologi PowerTune yang Ditingkatkan

Kembali pada tahun 2010, AMD memperkenalkan teknologi PowerTune dalam chip Cayman-nya (seri AMD Radeon HD 6900). GPU ini adalah fitur pertama kontrol dinamis listrik, yang disebut PowerTune. Ini memungkinkan kami untuk meningkatkan kecepatan clock maksimum untuk aplikasi biasa, sekaligus menghindari konsumsi daya yang terlalu banyak dalam uji stabilitas khusus seperti FurMark. Kemudian teknologi tersebut diterapkan pada model dual-chip AMD Radeon HD 6990, yang lebih membutuhkannya karena alasan yang jelas.

Teknologi tersebut menerima pembaruan besar pada pertengahan 2012, ketika peningkatan frekuensi otomatis - Boost - ditambahkan ke AMD PowerTune. Dalam AMD Radeon HD 7970 GHz Edition, algoritme ini memungkinkan lebih banyak peningkatan kinerja dibandingkan dengan versi reguler kartu video. Algoritme operasi PowerTune di kartu video tanpa overclocking otomatis menggunakan tiga status: diam (idle), mode beban ringan (low-3D) dan kecepatan penuh. Dalam HD 7970 GHz, mode overclocking Boost ditambahkan ke dalamnya. PowerTune berfungsi untuk tetap berada dalam konsumsi yang dibutuhkan dengan beralih ke mode beban yang lebih rendah bila diperlukan. Dalam hal ini, teknologi secara tajam mengurangi nilai frekuensi jam. Dalam praktiknya, lompatan seperti itu jarang terjadi - karena jarak yang besar antara dua mode aktif.

Mengurangi kecepatan jam GPU mengurangi konsumsi daya, tetapi Anda perlu mengurangi voltase untuk kontrol yang lebih baik. Inilah tepatnya yang dilakukan oleh Radeon HD 7790. Chip grafis Bonaire yang baru memiliki delapan status dengan pengaturan frekuensi dan voltase berbeda, memungkinkan kecepatan clock yang lebih tinggi dari sebelumnya, sambil memastikan bahwa GPU selalu berjalan pada voltase dan frekuensi optimal. Beralih antar status didasarkan pada beban GPU serta konsumsi daya GPU saat ini.

Dalam algoritme baru, PowerTune tidak harus menurunkan frekuensi secara tiba-tiba saat tingkat konsumsi terlampaui, dan seiring dengan frekuensi, voltase juga berkurang. Transisi status harus secepat mungkin agar tidak melebihi batas konsumsi bahkan untuk waktu yang singkat, jadi Bonaire mengganti status PowerTune setiap 10 ms, artinya, setiap detik, status chip berubah 100 kali.

Dengan perubahan frekuensi yang konstan, aplikasi pihak ketiga seperti MSI Afterburner dan GPU-Z tidak akan menampilkan laju jam instan, tetapi rata-rata selama periode waktu tertentu - yang disebut frekuensi "efektif". Inovasi menarik lainnya adalah AMD membuka pengaturan PowerTune baru untuk aplikasi pihak ketiga. Mitra juga dapat mengatur pengaturan PowerTune mereka sendiri untuk membantu membuat kartu grafis yang di-overclock pabrik dan menyediakan lebih banyak fitur di luar nilai referensi AMD. Apakah itu benar, pengaturan yang berbeda PowerTune dapat mengarah pada fakta bahwa kartu video dengan model yang sama dari pabrikan berbeda tidak hanya akan memiliki frekuensi jam yang berbeda, tetapi juga algoritme untuk mengubahnya dari waktu ke waktu, yang membuatnya sulit untuk dibandingkan dalam kondisi yang sama.

Penjualan kartu video model Radeon HD 7790 dimulai di pasaran pada awal April 2013. AMD, bersama dengan mitranya, mengatur peluncuran kedua motherboard dengan frekuensi referensi dan solusi overclock pabrik. Dan sekarang, kedua pabrikan meluncurkan kartu video baru ke pasar dengan cara yang hampir sama, dengan berbagai opsi yang tersedia dengan cepat dari mitra mereka. Faktanya, mitra telah merilis versi HD 7790 yang hampir lebih banyak di-overclock daripada versi konvensional, dan chip grafis di dalamnya beroperasi pada frekuensi sekitar 1075 MHz.

Detail: Model Radeon HD 7990

Kode nama "Malta"
Teknologi produksi: 28 nm
2 chip dengan masing-masing 4,3 miliar transistor
Arsitektur terpadu dengan rangkaian prosesor umum untuk pemrosesan streaming berbagai jenis data: simpul, piksel, dan lainnya.
Dukungan perangkat keras untuk DirectX 11.1, termasuk model shader Shader Model 5.0
Bus memori ganda 384-bit: dua kali enam pengontrol lebar 64-bit dengan dukungan memori GDDR5
Frekuensi GPU: 1000 MHz
Dua kali 32 Unit Komputasi GCN, termasuk 128 inti SIMD, yang terdiri dari total 4096 ALU floating point (format integer dan floating, dukungan untuk presisi FP32 dan FP64 dalam standar IEEE 754)
Unit tekstur 2x128, dengan dukungan untuk pemfilteran trilinear dan anisotropik untuk semua format tekstur
ROP 2x32 dengan dukungan untuk mode anti-aliasing dengan kemungkinan pengambilan sampel yang dapat diprogram lebih dari 16 sampel per piksel, termasuk dengan format framebuffer FP16 atau FP32. Performa puncak hingga 64 sampel per jam, dan dalam mode tanpa warna (khusus Z) - 256 sampel per jam
Dukungan terintegrasi hingga enam monitor melalui HDMI 1.4a dan DisplayPort 1.2

Spesifikasi Grafik Radeon HD 7990

Frekuensi inti: 1000 MHz
Jumlah prosesor universal: 4096
Jumlah unit tekstur: 2x128, unit pencampuran: 2x32
Frekuensi memori efektif: 6000 MHz (4×1500 MHz)
Jenis memori: GDDR5
Kapasitas memori: 2x3 gigabyte
Bandwidth memori: 2x288 gigabyte per detik
Tingkat pengisian maksimum teoretis: 64 gigapiksel per detik.
Laju pengambilan sampel tekstur teoretis: 256 gigatexel per detik.
Satu konektor CrossFire
Bus PCI Express 3.0
Konektor: DVI Dual Link, empat Mini-DisplayPort 1.2
Konsumsi daya hingga 375 W
Dua konektor daya tambahan 8-pin
Desain slot ganda
Harga yang disarankan untuk Rusia adalah 32.999 rubel. (untuk AS - $999).

Sudah di kartu video AMD generasi kedua, prinsip penamaan model dual-chip tetap tidak berubah. Solusi teratas berdasarkan dua chip video paling kuat berbeda dari kelas yang sesuai dari model generasi sebelumnya dengan digit pertama dalam indeks: alih-alih 6, ia menerima angka 7, yang menunjukkan seri baru. Kartu video yang diumumkan berbeda dari solusi chip tunggal dengan digit ketiga, menunjukkan kinerja maksimum dalam generasi tersebut.

Mengenai perbandingan dengan pesaing, untuk model Radeon HD 7990 yang diumumkan hari ini, saingan utamanya adalah kartu video GeForce GTX 690, yang dirilis hampir setahun yang lalu, dan solusi dua chip inilah yang harus saling bertarung. Benar, NVIDIA juga memiliki satu solusi yang lebih bertenaga, tetapi sudah berdasarkan pada satu GPU - GeForce GTX Titan, yang juga dapat dianggap sebagai pesaing papan AMD yang dimaksud.

Kartu video Radeon dual-chip baru dilengkapi dengan memori GDDR5 dengan kapasitas 3 gigabyte per GPU, yang disebabkan oleh bus memori 384-bit dari chip Tahiti. Volume seperti itu cukup dibenarkan untuk produk dengan level setinggi itu, karena dalam beberapa aplikasi game modern dengan pengaturan maksimum, mengaktifkan anti-aliasing, dan resolusi tinggi, jumlah memori yang lebih kecil (2 gigabyte per chip atau kurang) mungkin tidak lagi tersedia. cukup. Dan terlebih lagi ini berlaku untuk rendering dalam mode stereo atau pada banyak monitor dalam mode Eyefinity.

Jelas bahwa kartu grafis dual-chip yang kuat memiliki sistem pendingin dual-slot yang sangat besar yang berbeda dari pendingin kartu AMD tradisional. Ini menampilkan heatsink besar yang tersembunyi di bawah selubung dengan tiga kipas besar yang berjalan pada kecepatan yang relatif rendah. Konsumsi daya kartu dual-GPU cukup tinggi untuk alasan yang jelas, dan memiliki dua konektor daya 8-pin, tetapi setidaknya bukan tiga, seperti halnya sampel non-referensi berdasarkan dua chip Tahiti.

Arsitektur

Karena kartu video dengan nama kode "Malta" didasarkan pada dua GPU "Tahiti" dari keluarga Kepulauan Selatan, Anda dapat langsung merujuk ke, yang menjelaskan secara menyeluruh semua fitur arsitektur Graphics Core Next (GCN) saat ini. Dalam bahan dasar, kami hanya mengulangi karakteristik dan fitur paling penting dari produk tertentu.

Blok dasar arsitektur adalah blok GCN, dari mana semua seri GPU dirakit. Unit komputasi dibagi menjadi beberapa subbagian, yang masing-masing bekerja pada aliran perintahnya sendiri, ia memiliki penyimpanan lokal khusus untuk data, memori cache tingkat pertama dengan kemampuan membaca dan menulis, dan pipa tekstur lengkap dengan unit sampling dan filtering. Setiap blok GCN mampu menjadwalkan dan mendistribusikan perintah sendiri, dan satu blok komputasi dapat menjalankan beberapa aliran perintah independen. Radeon HD 7990 menggunakan dua chip Tahiti yang sudah kita kenal:

Diagram prosesor grafis (ada dua di Radeon HD 7990) menunjukkan 32 unit komputasi arsitektur GCN, dan semuanya aktif. Sebelumnya, diasumsikan bahwa untuk solusi dua chip, beberapa di antaranya harus dimatikan, dan bahkan menurunkan frekuensinya untuk memasukkan konsumsi daya 375 W, tetapi para insinyur AMD berhasil menyelesaikan tugas yang sulit ini. Mungkin revisi baru khusus Tahiti dengan konsumsi daya yang lebih rendah telah dirilis, atau chip hanya lolos seleksi yang sangat ketat.

Karena setiap unit GCN memiliki 16 unit tekstur, jumlah TMU adalah 128 unit per chip, yang memberikan kinerja total 256 gigatexel per detik, yang sangat bagus untuk pesaing GeForce GTX 690. Jumlah unit ROP dan pengontrol memori di HD 7990 juga tidak berubah dibandingkan dengan chip tunggal, masing-masing tersisa 32 dan 6 buah per GPU. Radeon HD 7990 memiliki bus memori ganda 384-bit yang terdiri dari dua belas saluran 64-bit dengan total bandwidth memori 576 GB/s, rekor lain.

Kalau tidak, dewan baru mendukung segalanya teknologi modern oleh AMD, yang diperkenalkan dan ditingkatkan dalam chip video baru dari jajaran Radeon HD 7000: PowerTune, ZeroCore, Eyefinity 2.0, HD3D, Steady Video, peningkatan kualitas pemfilteran tekstur, dll. Semua ini dijelaskan secara mendetail di atas dalam deskripsi Radeon HD 7970, dan tidak ada gunanya mengulanginya.

Sistem pendingin dan konsumsi daya

Dalam kasus papan chip ganda yang begitu serius, sistem pendinginan yang sangat efisien menjadi sangat penting. Jika dalam kasus solusi dari mitra berdasarkan dua Tahiti, solusi tiga slot digunakan, dan dalam kasus ASUS ARES II bahkan pendingin air, dalam hal ini perlu untuk mengelola dengan sedikit usaha, sehingga dirancang pendingin itu memiliki heatsink yang sangat masif dan tiga kipas dengan karakteristik akustik yang ditingkatkan.

Kebisingan sistem pendingin dan suhu yang disediakan untuk GPU adalah salah satu karakteristik konsumen terpenting untuk kartu video apa pun, termasuk solusi teratas yang dirancang untuk para penggemar. Sistem pendingin yang terlalu keras atau tidak efisien akan dianggap pembeli sebagai pembelian yang kurang menguntungkan, hal-hal lain (kira-kira) sama. Jadi AMD menangani masalah ini dengan sangat serius dengan Radeon HD 7990 jika dibandingkan dengan solusi teratas lainnya di pasaran. Mempertimbangkan karakteristik akustik sistem baru:

Diagram menunjukkan tingkat kebisingan dari tiga kartu video yang berbeda: Radeon HD 7990 dan dua pesaing: GeForce GTX 690 chip ganda dan GTX Titan chip tunggal dari NVIDIA. Selain itu, kebisingan diukur dalam kondisi yang berbeda - dalam mode diam (Sistem Diam) dan pada beban maksimum menggunakan Furmark. Jika angka-angka AMD dapat dipercaya, bahkan chip tunggal Titan masih jauh dari kebaruannya dalam hal kebisingan yang lebih dingin, belum lagi GTX 690 chip ganda, yang paling keras dalam perbandingan ini.

Tapi bukankah itu merugikan suhu GPU sehingga kinerja akustik yang begitu mengesankan tercapai? Bagan berikut menunjukkan suhu GPU yang diukur pada AMD Radeon HD 7990 dan dua kompetitor yang sama. Kali ini, AMD hanya menggunakan mode beban tinggi saat melakukan pengujian di Furmark.

Dan lagi, sumbu koordinat "licik" digunakan dengan asal bukan nol. Perbedaan nyata antara 80 dan 82 derajat untuk Radeon HD 7990 dan GTX Titan hampir tidak terlihat, meskipun 87 derajat untuk GTX 690 jelas lebih buruk. Sekali lagi, kami mencatat bahwa semua pengujian ini dilakukan oleh pihak yang berkepentingan dan tunduk pada verifikasi independen.

Dalam hal konsumsi daya, solusi dual-chip bukanlah hal baru, tetapi dukungan untuk teknologi ZeroCore Power yang diumumkan sebelumnya juga ada di sini. Teknologi ini membantu mencapai konsumsi daya yang jauh lebih rendah dalam mode "diam dalam-dalam" (atau "tidur") dengan perangkat layar dimatikan. Dalam mode ini, GPU menganggur hampir sepenuhnya dinonaktifkan, dan mengkonsumsi kurang dari 5% daya mode penuh, mematikan sebagian besar blok fungsional. Dan dalam kasus papan dua chip, bahkan lebih penting lagi bahwa dalam sistem CrossFire, saat menggambar antarmuka dua dimensi dari sistem operasi, semua GPU, kecuali yang utama, tidak berfungsi sama sekali. Artinya, dalam kasus Radeon HD 7990, salah satu chip dalam mode 2D akan terbenam dalam mode tidur nyenyak dengan konsumsi daya minimal, dan yang kedua dapat "tertidur" dalam mode siaga dalam PC.

Gim modern setiap tahun membutuhkan kartu video yang semakin kuat untuk pemrosesan grafis. Salah satu solusi anggaran untuk para gamer adalah AMD Radeon HD 7800 Series. Pertimbangkan karakteristik teknis dari seri ini, serta fitur dan performanya dalam game.

Simak ciri-ciri AMD Radeon HD 7800 Series dalam bentuk tabel:

Proses teknologi	28 nm
GPU	Pitcairn
GPU	Frekuensi (min.maks. pada model)	800-1000MHz
RAM	Jenis	GDDR5
	Volume	2GB
	Frekuensi	800-1200 MHz
	Bandwidth	153,6 GB/dtk
Antarmuka	Kapasitas memori	256-bit
Antarmuka	Jenis ban	PCI Express 3.0
Arsitektur	GCN
	Streaming prosesor per blok	dari 64 menjadi 80
	Jumlah blok	dari 16 sampai 20
	Total Pemroses Aliran	1024-1280
	Inti untuk pemrosesan geometri	2 buah.
	Core untuk komputasi asinkron	2 buah.
Konektor	HDMI Port Tampilan 1.2
Teknologi dan perangkat lunak yang didukung	DirectX 11	Ya
	OpenGL 4.2	Ya
	Eyefinity (Monitor Tautan)	hingga 6 pcs.
	Kekuatan Inti Nol	Modus tidur
	Katalisator	Driver dan pengaturan Proprietary
	Akselerasi Aplikasi	Meningkatkan kualitas pemutaran video
	AMDHD3D	pengolahan grafis 3D
	nada kekuatan	Pengaturan daya dinamis

Jalur ini diproduksi pada Maret 2012. Berdasarkan itu, model-model berikut dirilis:

HD7850;
HD7870;
HD7890.

Kisaran saat ini tidak lagi dalam produksi. Pada awal penjualan, harga rata-rata di toko adalah $249 dan $349.

Tinjauan

Di AMD, setelah rilis teknologi proses baru, diputuskan untuk membagi seri produksi umum menjadi beberapa subkelompok. Oleh karena itu, berdasarkan teknologi proses 28nm, dibentuk 4 jalur, yang disajikan dalam tabel:

HD 7800 dengan GPU "Pitcairn" menggunakan mikroarsitektur Graphic Core Next. Serial ini diluncurkan pada Maret 2012 dan saat ini tidak dicetak lagi.

Pada suatu waktu, kartu video dari Pitcairn cukup populer dan menunjukkan kombinasi harga / kualitas yang sangat baik. Untuk tahun 2018, seri saat ini tidak populer dan sangat sulit menemukan perangkat dalam kondisi baru. Terlepas dari kenyataan bahwa inti grafisnya sudah ketinggalan zaman, dalam perakitan dengan prosesor yang kuat, PC dapat menjalankan berbagai game pada pengaturan sedang dan tinggi.

Game apa yang akan berjalan di AMD Radeon HD 7800 Series

Kartu video dirilis pada tahun 2012, tetapi masih dapat digunakan pada mainan modern. Pengujian dalam game AMD Radeon HD 7800 Series dilakukan dengan perangkat keras berikut:

Prosesor: Inti I5 6500 3,2 GHz.
RAM: 16 GB DDR4 2133 Ganda.
Hardisk: Hitachi 1TB.
Papan Utama: Asus H170M-Plus.
Resolusi: 1920x1080px.

Hasilnya adalah sebagai berikut:

Nama permainan	Kualitas grafik
Sindikat Assassin's Creed	tinggi	31
Guntur Perang	Bioskop (Ultra)	55-65
Istirahat Kuantum	Rata-rata	30-42
Kesatuan Assassin's Creed	Rata-rata	30
Prajurit Bayangan 2	Tinggi	35-45
Lampu yang meredup	Tinggi	40-50
Kejatuhan 4	Ultra	38-43
GTA 5	Diatas rata-rata	45-50
MALAPETAKA	Tinggi	40
Bangkitnya Tomb Raider	Tinggi	30-40
perang	Tinggi	90-100
The Witcher 3: Darah dan Anggur	Tinggi	25-35
Dunia Tank	Tinggi	60-80

Performa keseluruhan sangat bergantung pada kombinasi prosesor dan kartu grafis yang tepat. Jika Anda mengambil prosesor yang kuat generasi modern seperti Ryzen atau Core i5, maka mereka akan dapat menampilkan FPS tinggi di sebagian besar game modern, bahkan dengan kartu video lama.

Setelah menganalisis karakteristik teknis dan pengujian dalam game, kami sampai pada kesimpulan berikut: beli untuk game yang kuat pada tahun 2018 tidak disarankan, lebih baik memilih model yang lebih baru.

Performanya akan cukup untuk pekerjaan rumah yang nyaman dan untuk menjalankan game multipemain seperti CS:GO, World Of Tanks.

Cara melakukan overclock kartu video

Untuk mencapai performa maksimal, Anda dapat melakukan overclock pada AMD Radeon HD 7800. Untuk melakukan ini, Anda perlu menginstal driver dan mengonfigurasinya.

Perubahan utama harus dilakukan di bagian "Game". Jika Anda menggunakan driver terbaru, profil dapat dikonfigurasi secara individual untuk setiap video game.

Arahkan ke profil yang diinginkan ke pengaturan Frame Rate Control. Secara default, kartu video menekan FPS maksimum dan menghabiskan semua sumber daya untuk itu.

Untuk permainan penembak yang nyaman, 60 frame per detik sudah cukup. Untuk CS:GO, WarFace, WarThunder cukup set limit 70 FPS.

Pengaturan OverDrive memungkinkan Anda menyesuaikan parameter pengoperasian: frekuensi GPU dan memori, efisiensi kipas, dan tingkat konsumsi daya. Pengaturan ini harus dikonfigurasi secara individual untuk setiap rakitan PC.

Pada tahun 2013, AMD merilis dua kartu grafis AMD Radeon HD 7800 Series dengan spesifikasi yang berbeda satu sama lain. Chip, yang dibangun di atas mikroarsitektur Graphic Core Next, menempati ruang yang setara dengan 2,8 miliar transistor. Seperti kebanyakan kartu dari Radeon, ada teknologi Eyefinity di sini, yang memungkinkan Anda menghubungkan hingga enam monitor secara bersamaan. Mereka dapat bekerja secara independen satu sama lain, atau dapat membentuk satu monitor besar. Itu semua tergantung pada pengaturan apa yang akan diekspos.

Radeon 7850

Kartu grafis AMD Radeon HD 7800 Series ini memiliki frekuensi prosesor 800 megahertz. Kinerja tinggi dan bandwidth (153 gigabit per detik) menyediakan ukuran bus 256 bit. Sistem komputasi memproses data sebesar 1,76 teraflops. Unit komputasi hadir dalam jumlah 16 buah, dan unit tekstur - dalam jumlah 64 buah. Ada dua inti untuk proses komputasi.

Format memori sesuai dengan penandaan GDDR5, dan dukungan untuk DirectX versi 11 akan membantu mempercepat interaksi dengan aplikasi sistem operasi. Untuk pengoptimalan yang lebih baik Untuk pengoperasian kartu, perlu untuk memantau pembaruan driver, karena hanya mereka yang dapat mengungkapkan sepenuhnya semua kemampuan GPU dan menyediakan akses ke pengaturan yang diperlukan. Driver dasar, yang menunjukkan kartu video dalam sistem, disertakan dengan kartu tersebut, dan versi yang diperbarui dapat dilihat di situs web AMD.

Prosesor grafis AMD Radeon HD 7800 Series ini dilengkapi dengan teknologi built-in terbaru yang memungkinkan Anda menikmati gambar berkualitas tinggi dan halus pada 60 frame, sementara resolusinya dapat mencapai hingga 4096 x 2160 piksel. Hal yang sama berlaku untuk aliran audio, yang memenuhi semua persyaratan modern, menghasilkan suara berkualitas tinggi.

Radeon 7870

Kartu grafis AMD Radeon HD 7800 Series ini merupakan penerus yang kuat dari kartu sebelumnya dalam hal karakteristik. Dia memiliki seluruh gigahertz untuk bekerja dengan prosesor grafis. Performa untuk operasi komputasi jauh lebih tinggi daripada versi sebelumnya - 2,56 teraflops. Ada 20 unit komputasi dan 80 unit tekstur.

Karena ini adalah unggulan dari seri 7800, ini melampaui saudaranya dalam banyak hal. Dukungan untuk teknologi tessellation telah dimasukkan ke dalam kartu video pabrikan ini sejak lama, tetapi dalam versi ini sudah dibatasi. Sekarang Anda dapat menikmati gambar tiga dimensi, mencolok dalam realisme dan detailnya. Dan peningkatan anti-aliasing akan membantu mencapai gambar yang halus dan menyenangkan.

Dalam parameter lain, perwakilan AMD Radeon HD 7800 Series ini sepenuhnya identik dalam hal karakteristik dengan kartu video sebelumnya. Kedua kartu tersebut mampu mendukung teknologi 3D baik dalam video maupun game. Dimungkinkan juga untuk terhubung untuk meningkatkan kinerja beberapa kartu, tetapi parameter yang diberikan mungkin juga tergantung pada kemungkinan papan utama.

Halaman 2 dari 5

"Pulau Selatan"

Pertama, sedikit tentang pelabelan AMD pada produk terbarunya. Pabrikan telah membaginya menjadi tiga level sesuai dengan kinerjanya. Nama kode "Cape Verde" mengacu pada Radeon HD 7700. Nama "Pitcairn" mengacu pada penguji Radeon HD 7870 dan HD 7850 saat ini.

Level awal = Tanjung Verde = Seri Radeon HD 7700;
Mainstream = Pitcairn = Seri Radeon HD 7800;
Produk berkinerja tinggi = Tahiti = Seri Radeon HD 7900.

Artinya, saat ini AMD telah mencakup semua segmen pasar dengan miliknya chip grafis 28 nm. Hanya rilis kartu video dual-core berdasarkan chip Tahiti yang diharapkan. Nama sementara Radeon HD 7990.

Fitur AMD Radeon HD 7800 Series

Prosesor grafis Radeon HD 7800 (Pitcairn) memiliki sekitar 2,8 miliar transistor dan mikroarsitektur Graphic Core Next. Seperti disebutkan di atas, chip Radeon HD 7850 (Pitcairn Pro) memiliki 16 unit komputasi, dan TDP maksimumnya adalah 130 watt. Untuk Radeon HD 7870 (Pitcairn XT), angka ini masing-masing adalah 20 dan 175.

Slide di bawah ini menunjukkan spesifikasi utama Kartu video Radeon HD7850 dan HD7870

Memori GDDR5 2GB sudah menjadi standar untuk sebagian besar model kelas menengah dan kelas atas. Berkat 256-bit. bus dan frekuensi clock tinggi 1200 MHz (efektif 4800 MHz), bandwidth 154 GB / s. Ini akan berdampak positif pada kinerja game dengan resolusi tinggi dan kualitas gambar.

antarmuka PCI Express 3

Pada paruh kedua tahun 2011, hampir semua produsen motherboard mempresentasikan model motherboard mereka antarmuka PCI Ekspresikan generasi ke-3. Dengan dirilisnya seri Radeon HD 7000, kartu video dengan antarmuka ini juga muncul. PCI Express 3 memiliki dua kali bandwidth (32 Gb/s) dari PCI Express generasi sebelumnya. Dibandingkan dengan PCIe 2, throughput per lajur telah digandakan dari 500 Mb/dtk menjadi 1 Gb/dtk.

Biasanya, untuk memanfaatkan PCIe 3 baru, Anda tidak hanya memerlukan kartu video dan motherboard dengan antarmuka ini, tetapi juga dukungan dari prosesor (tidak semua model dari keluarga Ivy Bridge akan mendukung PCIe 3).

Eyefinity 2.0

AMD melangkah lebih jauh dengan teknologi Eyefinity mereka, yang dirancang untuk menampilkan gambar di beberapa monitor. Berkat kekuatan pemrosesan yang tinggi dari seri HD 7000 dan dukungan untuk Eyefinity 2.0, kini dimungkinkan untuk menampilkan gambar pada beberapa monitor dengan resolusi total 16000 x 16000. Hal ini memungkinkan Anda untuk menampilkan gambar pada 5 layar dengan resolusi berukuran 2560x1600 diatur dalam orientasi lanskap. Untuk bekerja dengan resolusi seperti itu, rekor 3 GB GDDR5 (HD 7970 dan HD 7950) dipasang pada model keluarga yang lebih lama.

Driver AMD Catalyst akan mendukung resolusi khusus mulai bulan Februari. Artinya, Anda dapat mengatur resolusi yang diperlukan tergantung pada konfigurasi tampilan di Eyefinity. Pada Catalyst 12.2, ada opsi untuk mengatur menu Start ke tampilan yang nyaman bagi Anda, bukan paling kiri seperti dulu. Selain itu, Eyefinity 2 mendukung output stereo HD3D. Ini mendukung kombinasi tiga monitor yang bekerja dalam mode 3D.

Tesselasi yang lebih baik

Kartu grafis keluarga AMD Radeon HD 7000 menampilkan tessellator generasi kesembilan dan telah melihat peningkatan kinerja yang signifikan dalam pemrosesan geometri pada game saat ini. Inti GCN masih menyertakan dua Mesin Grafik, tetapi jika sebelumnya berisi blok untuk tesselasi dan rasterisasi, sekarang terdiri dari sejumlah pipa acak yang dirancang untuk memproses geometri dan piksel.

Kartu grafis AMD Radeon HD 7800 mendukung antarmuka HDMI 1.4a, yang memungkinkan Anda menampilkan gambar 120 Hz (60 Hz untuk setiap mata), yang memungkinkan Anda menampilkan gambar 3D. Dengan versi HDMI sebelumnya, hal ini tidak mungkin dilakukan. Mulai bulan Desember, AMD mengaktifkan kemampuan untuk kerja sama HD3D dan Eyefinity.

DirectX 11.1

Kartu video dari keluarga Radeon 7000 akan mendukung DirectX 11.1 mendatang. Apa yang akan diberikan dalam praktiknya terlalu dini untuk dikatakan, karena DX 11.1 akan dirilis bersama dengan Windows 8. Keuntungan utama dari API baru ini ditunjukkan sebagai berikut:

rasterisasi independen;
Kombinasi fleksibel komputasi grafis dan pemrosesan video;
Dukungan Stereo 3D asli.

Dekoder Video Terpadu AMD

Ini adalah bagian perangkat keras dari GPU AMD yang bertanggung jawab untuk decoding aliran video. Pada seri Radeon 7000, UVF menerima beberapa peningkatan. Secara umum, UVD tetap mempertahankan semua fitur pendahulunya, yaitu dukungan H.264/AVCHD, MPEG-2, MPEG-4/DivX, VC-1/WMV profile D, Multi-View Codec (MVC), Video Codec Engine (VCE), AMD Steady Video 2.0. Menambahkan dukungan untuk format Dual Stream HD+HD.

AMD telah secara resmi meluncurkan seri baru kartu grafis berdasarkan mikroarsitektur GCN 28nm - AMD RadeonHD7800. Saat ini, ini mencakup dua model: dan. Item baru berdasarkan grafik Prosesor AMD"Pitcairn Pro" dan AMD "Pitcairn XT", yang masing-masing memiliki clock 860 MHz dan 1000 MHz. Dengan demikian, kartu video akan menjadi yang kedua rentang model perusahaan (setelah AMD Radeon HD 7770) dengan nama "Ghz Edition".

Solusi tersebut dilengkapi dengan 16 unit komputasi, 1024 prosesor aliran, 64 unit tekstur, dan 32 unit ROP. Subsistem video kebaruan terdiri dari chip GDDR5 256-bit dengan kapasitas total 2 GB. Frekuensi clock nominal mereka berada pada level 1200 MHz, dan yang efektif adalah 4800 MHz.

Bagian antarmuka eksternal model termasuk empat port: DVI, HDMI dan dua miniDisplayPort.

Adaptor grafis memiliki struktur yang lebih baik, yang meliputi: 20 unit komputasi, 1280 prosesor aliran, 80 unit tekstur, dan 32 unit ROP. Subsistem video dari kebaruan ini, serta rangkaian antarmuka eksternalnya, identik dengan .

Penjualan massal solusi dan dimulai dari 19 Maret. Harga eceran yang disarankan untuk produk baru ini masing-masing adalah $249 dan $349. Tabel perbandingan spesifikasi teknis kartu video baru dari seri ini AMD RadeonHD7800 memiliki bentuk sebagai berikut:


Standar proses produksi, nm
mikroarsitektur
GPU		AMD "Pitcairn Pro"	AMD "Pitcairn XT"
	Frekuensi jam, MHz
Jumlah unit komputasi
Jumlah pemroses aliran
Jumlah blok tekstur
Jumlah blok ROP
memori video
	Volume, GB
	Frekuensi clock terukur, MHz
	Frekuensi jam efektif, MHz
	Lebar bus, sedikit
Antarmuka dalam		PCI Express 3.0 x16
Antarmuka eksternal		1 x DVI 1 xHDMI 2x miniDisplayPort
Perkiraan harga, $
Instruksi dan teknologi yang didukung		DirectX 11.1, DirectCompute 11, OpenGL 4.2, OpenCL 1.2, AMD Eyefinity, AMD CrossFireX, AMD HD3D, AMD PowerPlay, AMD PowerTune, AMD Eyespeed, AMD ZeroCore