Stručně jsem to přeložil, takže pokud neumíte německy...

- 681mio Transen
- neue ROPs mit FP32 + MSAA
- 128 Steam Prozzies mit 1350Mhz (1 Skalar pro Takt) = 518,4GFLOP/s
- WUAF
- besseres Dynamic Branching
- besseres Early Z

Streaming Proc.:
Bisher konnten GPUs (Verktorprozzies) einen RGBA Wert auf einemal berechnen. Da aber nicht immer vier Vektoren benötigt werden müssen die ALUs nicht mehr 3:1 oder 2:2 aufgeteilt werden. Somit steigert die die effizeinz. Ein skalar ist im Prinzip ein einkanaliger Vektor. Der Shader-Compiler hat somit einen einfacheren Job.
Die 128 Streaming Proc. sind aus gründen der Cacheverwaltung zu 16ALUs zusammengefasst. Jede dieser ALUs kann pro Takt eine MADD und eine MUL ausführen.
Wenn man die reine MADD Leistung vergleicht kommt man auf 345,6GLOP/s
681 milionů tranzistorů
podpora FP16/FP32 HDR včetně FSAA
128 unifikovaných stream-procesorů s 1D (=skalární) architekturou - předchozí čipy měly shader jendotky s architekturu 3D:1D (=vektorovou část pro operace se třemi komponentami a skalární pro operace s jednou komponentnou), případně 2D:2D. Rozdělení na samostatné 1D (skalární) ALUs umožňuje rovnoměrnější vytížení zátěže a zvýšení efektivity. S tím souvisí i efektivnější dynamic branching (jemnější granularita). Stream-pr. jsou uspořádány ve skupinách po 16ti. Každý SP umí operaci MUL a MADD.

stream-procesory běží na 1350MHz

Textureinheiten:
Acht Bilineare Textureinheiten sind integriert. Allerdings nur 4 Textur Address Proc. pro Gruppe. Insgesamt können daher 64 bi-Texel pro Takt berechnet werden, aber nur 32 adressiert. Die restlichen TMUs können per Koordinaten Offset zusätzlkiche Daten samplen, wenn wenigstens eine Dimension mit der ersten übereinstimmt (z.B. 2:1 Bi-AF).
TMUs haben eine eigene Adresseinheit, es muß nicht mehr der Pixel-Shader verwendet werden. -> TMU Latenz entschärft.
texturovací jednotky - je jich 64, ale nejsou srovnatelné se současnými; polovina je "plnohodnotná", každá TMU z této poloviny má vlastní ALU pro adresování textur (G7x tohle neměla, pro tyhle účely využívala primární ALU pixel shaderu - G80 tedy už pro pro adresování textur vlastní jednotku a neubírá při těchto operacích výkon pixel shaderu). Druhých 32 TMUs nemá vlastní jednotku pro texture adressing a jsou výrazněji vytíženy především při náročnější filtraci textur. TMUs běží na stejné frekvenci, jako jádro, tedy 575MHz.
AA:
Es wir 4/8/16 MSAA geben.
Neu ist zuschaltbares 'Coverage Sampling AA'. Dies ist ein Kopressionsverfahren, welches aber nicht immer Kompatibelsein soll. Die 16 Zufällig verteilten Subpixel verden auf den Bedekungsgrad als Booleanwert (Wahr/Falsch) gespeichert. Das ergebnis wird auf 4x oder 8x MSAA Kompromiert.
AA - režimy 4/8/16x s novým systémem komprese, jehož výsledkem je (při AA 16x) snížení objemu dat na úroveň jako při AA 4x nebo 8x = nižší propad výkonu.

ROPs:
Es gibt 6 ROP Cluster, jeder Cluster ist mit 64bit bei 900Mhz angebunden. Somit die 384bit.
Bei der GTS ist es ein Cluster weniger. Je ROP vier Pixel mit Farb- und Texturinfo.
Z-und Stencil-Ops weiter getuned.
ROPs jsou uspořádány v 6 skupinách po čtyřech. ROPs běží na stejné frekvenci, jako paměti.