Maxwell (mikroarkitektur)

Den aktuella versionen av sidan har ännu inte granskats av erfarna bidragsgivare och kan skilja sig väsentligt från versionen som granskades den 29 maj 2020; kontroller kräver 4 redigeringar .
Maxwell
Utgivningsdatum Februari 2014
Tillverkare TSMC
Pascal

Maxwell  är kodnamnet för en GPU -mikroarkitektur utvecklad av Nvidia som en efterföljare till Kepler -mikroarkitekturen . Maxwell-arkitekturen introducerades i senare modeller av GeForce 700-serien och används även i GeForce 800M-serien , GeForce 900-serien och Quadro Mxxx-serien. Nvidia tog Kepler som grund för den nya Maxwell-arkitekturen och förfinade den på flera områden. I Maxwell-arkitekturen döptes SMX- strömmande multiprocessor om till SMM ( engelsk  Streaming Maxwell Multiprocessor ), uppdelad i fyra block med 32 streamprocessorer. Totalt innehåller SMM-klustret 128 strömprocessorer. Mindre komplex kontrolllogik säkerställer effektivare distribution av uppgifter över CUDA- kärnor . Spånarean ökade med 25 % från 118 mm² till 148 mm². Samtidigt ökade antalet transistorer från 1,3 miljarder till 1,87 miljarder, en ökning med 44 %. Anledningen ligger i förändringen av chipets layout.

Mikroarkitekturen är uppkallad efter James Clerk Maxwell , grundare av teorin om elektromagnetisk strålning .

Funktioner i Nvidia Maxwell-arkitekturen

Ökat tilldelat delat minne

Maxwell-arkitekturen ger 64 KB distribuerat (registrerat) minne, medan i Fermi eller Kepler är detta minne uppdelat mellan L1-cachen och distribuerat minne. I Maxwell kan ett block använda upp till 48 KB distribuerat minne, och en ökning av den totala mängden av detta minne kan leda till en ökning av belastningen på multiprocessorn. Detta möjliggjordes genom att kombinera funktionaliteten hos L1-cachen och texturcachen i ett separat block.

Snabbare atomoperationer i delat minne

Maxwell-arkitekturen introducerade inbyggda atomoperationer på 32-bitars heltal i distribuerat minne, såväl som CAS-operationer på 32-bitars och 64-bitars värden i minnet - de kan användas för att implementera andra atomfunktioner. I fallet med Kepler och Fermi fick en komplicerad lås/uppdatera/upplåsningsprincip användas, vilket resulterade i extra kostnader.

Dynamisk samtidighet

Dynamisk parallellism, introducerad med Kepler GK110, gör att GPU :n kan skapa uppgifter för sig själv. Stöd för denna funktion lades först till i CUDA 5.0, vilket gör att trådar på GK110 kan köra ytterligare kärnor på samma GPU.

Kakelrendering

För första gången för Nvidia och GeForce-serien av grafikkort har kakelrenderingsteknik introducerats för att öka prestandan och minska minnesbelastningen. [1] [2] Samtidigt har AMD:s konkurrenter praktiskt taget inte det, denna teknik saknas fortfarande i dagsläget, det enda undantaget är VEGA-serien med HBM-minne.

Jämförelse mellan Kepler och Maxwell

Egenskaper Kepler Maxwell
GPU GK107 (Kepler) GM107 (Maxwell)
CUDA kärnor 384 640
basfrekvens 1058 MHz 1020 MHz
GPU-boostfrekvens n/a 1085 MHz
gigaflops 812,5 1305,6
Datorfunktioner 3.0 5.0
Distribuerat minne / SM 16 KB / 48 KB 64 KB
Registrera filstorlek / SM 256 KB 256 KB
Maximalt antal block 16 32
Minnesfrekvens 5000 MHz 5400 MHz
L2 cachestorlek 256 KB 2048 KB
TDP 64 W 60 W
transistorer 1.3 miljarder 1,87 miljarder
Kristallområde 118 mm² 148 mm²
Processteknik 28 nm 28 nm

efterföljare

Nästa arkitektur efter Maxwell kom under kodnamnet Pascal . [3]

Anteckningar

  1. ↑ Huvudhemligheten med effektiviteten hos nya NVIDIA-arkitekturer avslöjas . 3DNews - Daily Digital Digest. Hämtad 1 mars 2019. Arkiverad från originalet 2 mars 2019.
  2. Kakelrendering - det hemliga receptet för Maxwell/Pascal-arkitektur . www.hardwareluxx.ru Hämtad 1 mars 2019. Arkiverad från originalet 2 mars 2019.
  3. NVIDIA uppdaterar GPU-färdplanen; Tillkännager Pascal Arkiverad 25 mars 2014 på Wayback Machine // NVIDIAs officiella blogg, 25 mars 2014