엔비디아, 테슬라 V100 컴퓨팅 가속기 공개



NVIDIA updated its compute accelerator product stack with the new Tesla V100s. Available only in the PCIe add-in card (AIC) form-factor for now, the V100s is positioned above the V100 PCIe, and is equipped with faster memory, besides a few silicon-level changes (possibly higher clock-speeds), to facilitate significant increases in throughput. To begin with, the V100s is equipped with 32 GB of HBM2 memory across a 4096-bit memory interface, with higher 553 MHz (1106 MHz effective) memory clock, compared to the 876 MHz memory clock of the V100. This yields a memory bandwidth of roughly 1,134 GB/s compared to 900 GB/s of the V100 PCIe.

NVIDIA는 GPU의 코어 클럭 속도에 대한 변경 사항을 자세히 설명하지 않았지만 제공되는 성능 처리량 수치는 다음과 같이 언급했습니다. V6.4 PCIe에서 14 TFLOP / s에 비해 16.4 TFLOP / s 단정도; V100 PCIe에서 130 TFLOP / s 딥 러닝 ops 대 112 TFLOP / s. 회사 정격 전력 수치는 250W 일반 보드 전력에서 그대로 유지됩니다. 회사는 가격을 공개하지 않았다.