Kayıt
18 Ağustos 2007
Mesajlar
4.875
Beğeniler
0
Oyunculara göre performans, oyunculara göre fiyatlandırma...


Antialiasing Öncelikli Yeni Mimari


AMD'nin yeni grafik işlemcileri daha önceki R600 ve türevlerine, özellikle de HD 3800 serisinin merkezindeki RV670'e dayanıyorlar. Yani RV770, bütünüyle sıfırdan tasarlanmış bir işlemci değil. Bununla birlikte, RV770'de eski mimari baştan başa elden geçirilerek problemleri giderilmiş ve geliştirilmiş. Yapılan geliştirmeler arasında shader ünitesi sayısının müthiş sayıda arttırılması (320'den 800'e), yeni bir bellek kontrolcüsü ve grafik işlemcinin doku işleyen tüm bölümlerinin, yüksek antialiasing performansı için tekrar elden geçirilmesi var.



Öncelikle, işlemcinin iç yapılandırılışı ve işlem ünitelerinin bölümlenişi bütünüyle değişmiş. Yeni işlemcide işlem çekirdekleri (SIMD Core) her biri 40 değil, 80 işlem ünitesi içerecek şekilde üretilmişler. 10 adet SIMD çekirdeği içeren RV770'de toplam 800 işlem ünitesi var. 80 işlem üniteli yapıya bakarsak, daha ileride çıkacak HD 4350 gibi kartların en az 1 SIMD çekirdeği ve 80 işlem ünitesiyle geleceklerini anlayabiliriz.


RV770 işlemcinin genel yapısı...

Artan işlem ünitelerini beslemek için, doku işlem üniteleri de ciddi sayıda arttırılmış. Eski mimaride 16 olan bu sayı artık 40 düzeyinde. Aslına bakarsanız, bu değerdeki %250 artış, işlem ünitelerindeki %250 artışla aynı düzeyde. İşlemcinin en küçük yapıtaşına inersek, işlem ünitelerinin yine beşli gruplar halinde sıralandıklarını görüyoruz. Yalnız ATI burada iyileştirmeler yaparak %40'a varan performans artışları elde etmiş. Yapısal olarak bir üst düzeye çıktığımızda, bu beşli işlemci gruplarından 16 tanesini (16x5 = 80 işlem ünitesi) barındıran SIMD çekirdeği karşımıza çıkıyor. Her bir SIMD çekirdeği kendine özel 16 kilobyte bellek alanına sahip, ayrıca diğer çekirdeklerle haberleşmesi için paylaşımlı kullandığı bir 16 kilobyte daha alan var. Ayrıca, her bir çekirdek kendine özel 4 doku ünitesi ve L1 tampon bellek barındırıyor.



Antialiasing performansını arttırmayı amaçlayan yeni mimari, doku ünitelerine özel bir önem verilmesini gerektirmiş. Yeni doku üniteleri, eskilerine göre mm2 başına %70 daha performanslılar. Yeni üniteler tampon belleklerini daha iyi kullanıyorlar ve saniyede 160 doku örneğini işlemek üzere çağırabiliyorlar. Doku ünitelerinin hem L1, hem de L2 tampon bellekleri var, ayrıca vertex bilgisi için ayrı bir tampon bellek kullanıyorlar. L1 ile L2 tampon bellek arasında veri aktarım hızı saniyede 384 GB'a varıyor.


AMD'nin verilerine göre HD 4800 serisi ve rakiplerinin doku işleme başarımları

Yeni işlemcide, antialiasing işleminin asıl gerçekleştiği Render Backend üniteleri de elden geçirilmiş. Sonuçlar şaşırtıcı, AMD'nin verilerine göre bu ünitelerin performansı, tüm antialiasing modlarında tam olarak iki katına çıkmış. AMD, 8x AA modunun artık ciddi bir performans kaybı yaşanmadan aktifleştirilebileceğini belirtiyor. Ayrıca, bellek olarak 8x modundan fazla yer tutmayan, özel 12x ve 24x modları geliştirilmiş. Bu modlardan "Edge Detect" modunun en güzel yönlerinden birisi, şeffaf dokulardaki filtrelemeyi iyileştiren Adaptive Antialiasing sistemiyle birlikte çalışabilmesi. Bu sayede AMD, en iyi antialiasing kalitesini sağlamak iddiasında.


Yapılan değişiklikler, özellikle Fourier dönüşümlerinde performansı yediye katlamış

Tabii grafik işlemcinin artan işlem gücü, işlemcinin oyunlar ve grafik uygulamaları dışındaki alanlardaki başarısına da yansıyor. AMD'nin yaptığı iyileştirmeler, işlemcinin özellikle FFT (Fast Fourier transform) işlemlerindeki başarısını tam 7 kat arttırmış. Yine çok kullanılan bir işlem olan tamsayı bit kaydırma işlemlerindeki performans artışıysa 3800 serisine göre tam 12.5 kat düzeyinde. Bu büyük işlem gücünün her türlü uygulamaya açılabilmesi için süren arayışlar konusundaysa AMD, Apple'ın ilk adımlarını attığı OpenCL sistemine destek verdiğini açıklıyor.

Değişen Bellek Kontrolcüsü ve GDDR5 Desteği


Tasarımcılar, RV770'de en büyük değişiklikleri bellek kontrolcüsü üzerinde yapmışlar. Öncelikle, ilk olarak R520 (Radeon X1800 XT) ile karşımıza çıkan ve R600 neslinde de devam eden Ring Bus mimarisi artık terkedilmiş. Bunun yerine, birden çok bellek kontrolcüyü en çok bellek işlemi yapan birimlerine yanıbaşlarına yerleştiren ve merkezi bir toplanma noktası (hub) kullanan yeni bir tasarım yapılmış. Bellek kontrolcüler bellekle direkt olarak konuşabiliyorlar, hub ise çok hızlı veri akışı gerektirmeyen diğer birimleri birbirine bağlıyor ve belleğe erişmelerini sağlıyor. Örneğin PCI Express arabirimi, UVD modülü ve Crossfire modülü hub üzerinden belleğe erişiyorlar.

ATI'nin yeni bellek mimarisi 256 bit bellek arabirimi kullanılması hedeflenerek tasarlanmış, böylece 512 bit hedefli eski R600 mimarisinin karmaşıklığından uzaklaşılmış. Sonuçta, bellek kontrolcülerin olabilecek en iyi verimle çalışmaları sağlanmış. AMD'nin sağladığı değerlere göre, HD 3800 serisinde var olan bant genişliğinin en fazla %85'ini kullanabilen grafik işlemcisi artık aynı bant genişliğinin %95'ini kullanıyor. %100 verime ulaşılmasının zaten imkansıza yakın olduğu düşünülürse, bu gerçekten çok ama çok iyi bir değer. AMD, 256 bit bellek arabirimi kullanarak, yani çok daha ucuz üretilebilen baskılı devre kartlarıyla saniyede 115 GB bellek bant genişliği sağlayabildiklerini ifade ediyor.


Yeni bellek kontrolcüsü 256 bit bellek arayüzü hedeflenerek düzenlenmiş

Yeni bellek kontrolcüsüyle birlikte gelen bir diğer yenilikse GDDR5 desteği. Yeni bellek teknolojileri konusunda sürekli arayış içinde olan ATI, GDDR4 bellekleri de ürünlerinde kullanmıştı ama GDDR4 grafik piyasasında asla çok yaygınlaşmadı. ATI şimdi daha da yeni bir bellek teknolojisi olan GDDR5'i hayata geçiriyor. GDDR5'in, GDDR4 gibi olmayacağı özellikle belirtilmekte, çünkü GDDR5 daha çok bellek yongası üreticisi tarafından destekleniyor (Hynix, Quimonda ve Samsung) ve GDDR3'e göre daha ciddi avantajlar sağlıyor.

GDDR5, 1.5 Volt çalışma gerilimine gerek duyuyor. Tek bir yongadan çalışma hızına göre 12.8 ile 28 GB/sn veri aktarımı sağlayabilen GDDR5, hem iletişim protokolü, hem hata düzeltme olanakları, hem de gecikme düzeyleri açısından GDDR3 ve 4'e göre çok daha üstün. GDDR5 yongaları kendi içlerinde sıcaklık ölçme olanağına sahipler ve sıcaklığa göre veri aktarım hızlarını da ayarlayabiliyorlar. Üstelik, GDDR5'in bağlı olduğu veriyolunu tanıyarak öğrenebilme olanağı, baskılı devre tasarımındaki bir çok sorunu ortadan kaldırıyor. Devrenin tasarımı sırasında, sinyallerin yol alacağı yolların uzunluklarını eşit tutabilmek için yapılan cambazlıklar GDDR5 ile daha kolay çözülebilen sorunlar haline geliyor. GDDR5'deki hata belirleme ve düzeltme sistemlerininse özellikle ekran kartının genel amaçlı uygulamalarda kullanıldığı senaryolarda önem kazanacağı hatırlatılmakta.


GDDR5'in "öğrenme" yeteneği, baskılı devre tasarımındaki bazı gelenekselleşmiş
sorunları basitleştiriyor. Örneğin, veriyollarının uzunluğunu eşitlemek için yapılan
zigzaglara artık gerek duyulmamakta.

GDDR5, ekran kartları için yeni bir bellek standartı olmaya aday. Burada tek sorun, her yeni ürün gibi GDDR5'in de ilk aşamalarda üretim miktarı açısından sorun yaşayacağı. NVIDIA'nın GDDR5 kullanmaması AMD için hem bir avantaj, hem de dezavantaj. NVIDIA GDDR5 kullanmadığı için AMD üretilen tüm GDDR5 stoğunu tek başına satın alabiliyor, üretilen az sayıda ürün için rekabet etmesi gerekmiyor. Öte yandan, NVIDIA GDDR5 kullanmaya başlamadığı sürece üreticiler üretim bantlarını GDDR3'den GDDR5'e geçirmekte yavaş davranacaklar. Yine de, bizce AMD GDDR5'i seçmekle doğru bir hareket yapıyor ve çok daha yüksek bellek bant genişliklerini, daha düşük gerilim, güç ve sıcaklık değerleriyle elde ediyor. NVIDIA ise eski ama kendini ispat etmiş GDDR3 bellekleri, çok geniş bellek veriyollarıyla kullanmayı tercih etmekte. Bu, GeForce GT200 serisine hem çok karmaşık (dolayısıyla pahalı) baskılı devre kartları, hem yüksek güç tüketimi, hem de üretilmesi güç, fiziksel olarak büyük boyutlu işlemciler olarak yansıyor. Bellek mimarisi açısından ATI, NVIDIA'dan çok daha önde, bu çok net olarak görülüyor.

GDDR5 bellekler ilk olarak karşımıza HD 4870 ile birlikte çıkacaklar, bu kart bugünlerde piyasaya çıkmak üzere. Daha ekonomik olan HD 4850 ise şimdilik GDDR3 ile yola devam edecek, ama ileride GDDR5'in bollaşması durumunda dileyen üretici GDDR5 ile donatılmış, bellek açısından dopingli HD 4850 kartları üretebilecek.
 
Yukarı Alt