Тренировка алгоритмов ResNet-50, набор данных: ImageNet2012, размер пакета 256 | Сравнение NVIDIA V100: сервер NVIDIA DGX-2™, 1 ускоритель V100 SXM3-32 Гб, фреймворк MXNet 1.5.1, контейнер = 19.11-PY3, операции с различной точностью, производительность: 1,525 изображений/с | Сравнение Intel: Supermicro SYS-1029GQ-TRT, Intel Gold 6240 с частотой 2 Ггц/3,9 Ггц в режиме турбо, Tensorflow 0.18, FP32 (доступна только эта точность), пропускная способность: 48 изображений/с
GPU NVIDIA V100 С ТЕНЗОРНЫМИ ЯДРАМИ
Первый GPU с тензорными ядрами