NVIDIA GK110: alcuni dettagli in più sull’architettura


In occasione del GPU Technology Conference NVIDIA ha annunciato la scheda Tesla K20, soluzione destinata alle elaborazioni parallele di GPU Computing di fascia più alta attesa al debutto nel corso del quarto trimestre 2012. Per questa soluzione NVIDIA adotterà per la prima volta il chip GK110, soluzione top di gamma nella famiglia di GPU Kepler destinato a stabilire nuovi riferimenti in termini sia di complessità architetturale sia di prestazioni velocistiche.

NVIDIA non ha per il momento fornito specifiche tecniche dettagliate su questa soluzione, mettendo a disposizione in ogni caso alcuni dati che permettono di delinearne le principali caratteristiche. Partiamo da processo produttivo e dimensioni: GK110 sarà costruito da TSMC con tecnologia a 28 nanometri, la stessa di GK104, integrando un totale di 7,1 miliardi di transistor. Non abbiamo dettagli sulla superficie del die ma sarà presumibilmente molto importante, visto il numero di transistor integrati.

tesla_k20.jpg (37390 bytes)
Tesla K20: la prima scheda dotata di GPU GK110

GK110 integrerà un totale di 15 SMX, ciascuno dotato di 192 CUDA cores per un totale di 2.880 cores; gli SMX saranno basati sulla stessa architettura di quanto visto in GK104 ma presumibilmente implementeranno alcune differenze. Nella GPU sarà integrata memoria cache L2 per un quantitativo di 1,5 Mbytes, mentre il bus memoria sarà pari a 384bit contro quello a 256bit adottato per le schede a singola GPU basate su architettura GK104.

GK110 implementerà unità di calcolo in double precision molto più potenti di quanto integrato in GK104: per questo motivo la scheda Tesla K20 viene proposta da NVIDIA specificamente per quegli ambiti nel GPU Computing che prediligono double precision nell’elaborazione. In ogni SMX saranno presenti 64 CUDA FP64, contro i soli 8 presenti in GK104: da questo una capacità di elaborazione in double precision nettamente superiore.

gk110_schema_1.jpg (32015 bytes)

Restando in ottica GPU Computing il chip GK110 implementerà due funzionalità uniche nel panorama delle GPU NVIDIA attualmente presenti sul mercato. La prima prende il nome di Hyper-Q ed indica la capacità della GPU di gestire task simultanei in Kepler, sino ad un massimo di 32, contro il singolo task che poteva essere eseguito con le soluzioni della famiglia Fermi. Questo approccio tende a massimizzare il tasso di occupazione della GPU, facendo in modo che tutte le unità di elaborazione siano nei limiti del possibile utilizzate.

gk110_schema_2.jpg (35866 bytes)

Dynamic Parallelism indica invece la capacità del chip GK110 di fare in modo che un kernel possa inviare a sua volta un kernel, mentre in Fermi tale opzione era limitata richiedendo un intervento diretto della CPU. Operando in questo modo GK110 permette di liberare la CPU da alcune delle operazioni, riducendo parallelamente la latenza delle operazioni.

Quando vedremo alla luce le prime schede delle famiglie GeForce e Quadro dotate di chip GK110? Al momento non possiamo dirlo ma crediamo che NVIDIA tenderà a privilegiare prima le soluzioni Tesla e in seguito ad adottare questa architettura per schede della famiglia Quadro. Nel confronto competitivo con AMD, restando nel segmento delle soluzioni desktop per pubblico consumer, la GPU GK104 adottata nelle schede GeForce GTX 690, 680 e 670 ben si comporta nel confronto competitivo con le soluzioni AMD basate su architettura Southern Island pertanto non sembra esserci grande necessità di presentare già nel quarto trimestre 2012 schede GeForce con GPU GK110.

Non conosciamo nello specifico i piani di NVIDIA a riguardo, ma è presumibile che non appena AMD avrà a disposizione un’architettura di GPU di nuova generazione per il segmento desktop NVIDIA possa spingere GK110 anche su schede della famiglia GeForce, così da potersi meglio posizionare nel confronto con la concorrente.