La nueva tarjeta de computación NVIDIA Tesla K20 ha sido diseñada para ser líder en aplicaciones que requieran operaciones de supercomputación con operaciones en coma flotante de doble y simple precisión. Esta tarjeta cuenta con una única GPU Kepler GK110 con 2.496 núcleos e incluye paralelismo dinámico y características Hyper-Q.
Con un rendimiento de más de un teraflop de precisión doble, estos aceleradores GPU son ideales para estaciones de trabajo de alto rendimiento con cargas de trabajo muy elevadas. Aplicaciones de predicción meteorológica, clima, CFD, CAE, física computacional, bioquímica, simulaciones y finanzas computacional.
La nueva arquitectura kepler incluye estas tecnologías:
SMX (Streaming multiprocesador)
Ofrece hasta 3 veces más de rendimiento por vatio que su precedesora NVIDIA Tesla Fermi. También ofrece un petaflop de calculo.
Paralelismo dinámico
Permite generar de forma automática y dinámica nuevos procesos a los hilos de la GPU. Adaptándose a los datos, de este modo no necesita realizar nuevos accesos a al GPU. De este modo se simplifica enormemente la programación paralela.
Además permite aceleración GPU de un amplio conjunto de algoritmos populares, como "adaptive mesh refinement" (AMR), "fast multipole method" (FMM), "multigrid methods".
Hyper-Q
Permite que varios núcleos de la CPU puedan utilizar la tarjeta GPU Kepler, esto aumenta enórmemente el uso de la GPU. Es ideal para grupos de aplicaciones que utilizan MPI.
Características :
Memoria ECC con protección de errores
Cumple con el requisito de los dentros de datos y centros de supercomputación en cuanto a la exactitud y fiabilidad de la informatica.
Caracterísiticas del monitor de sistema
La GPU tiene un subsistema con capacidad de gestión y monitoreo del sistema. Tiene herramientas como IPMI o herramientas OEM de propietario. De este modo el personal tecnológico ahora puede gestionar los procesadores GPU utilizando un ámplio abanico de soluciones de gestión.
Caché L1 y L2
Acelera algoritmos como solucionadores de física, trazado de rayos, y "sparse matrix multiplication" donde las direcciones de datos no son conocidos de antemano.
Transferencia asincrónica con dos motores DMA
Acelera el rendimiento del sistema mediante transferencia de datos a través del bus PCIe mientras que los núcleos de computación manejan otros datos.
Programación flexible con amplio soporte de programación y APIs
Puede elegir OpenACC, herramientas CUDA para C, C++ o Fortran.
Especificaciones técnicas :
KEPLER: LA ARQUITECTURA DE HPC MÁS RÁPIDA DEL MUNDO
Consigue 3 veces más velocidad de procesamiento con NVIDIA® Kepler, la arquitectura de alta computación (HPC) más rápida y eficiente del mundo. Está dotada de tecnología y funciones de computación avanzadas, puede utilizarse en una extensa variedad de aplicaciones de cálculo científico y pone los sistemas de computación híbridos al alcance de mayor número de programadores e investigadores.
El excepcional rendimiento de Kepler se debe a:
SMX
Proporciona mayor velocidad de procesamiento y eficiencia gracias a su innovador multiprocesador de streaming, que permite dedicar más espacio a los núcleos de procesamiento que a la lógica de control.
GPU dinámica con Kepler
Simplifica la programación en la GPU ya que facilita la aceleración de bucles anidados paralelos, lo que significa que una GPU puede iniciar nuevos subprocesos de forma dinámica por sí misma, sin necesidad de volver a la CPU. Encontrarás más información en el Informe técnico sobre paralelismo dinámico
MÁS INFORMACIÓN SOBRE NVIDIA KEPLER
Resumen técnico Kepler Compute Architecture
Kepler Compute Architecture - Artículo técnico
Hyper-Q de Kepler
Reduce el tiempo de inactividad de la CPU al permitir que múltiples núcleos de ésta utilicen una misma GPU Kepler, lo que mejora drásticamente la programabilidad y la eficiencia.
MATERIAL DE REFERENCIA