NVIDIA H100 张量核心 GPU
如果您想知道摩尔定律为何在 ChatGPT 等技术不断进步的同时却如此缓慢,那么这就是正在发生的事情。
Nvidia 的最新芯片 H100 在 FP64 下能够达到 34 teraFLOPS,这是超级计算机排名的 64 位标准。 然而,该芯片在 FP8 下可以执行 3,958 TeraFLOPS。 FP8 的精度比 FP64 低 8 倍。 Tensor Core 还可以加速矩阵运算。 这包括矩阵乘法、累加和矩阵乘法。 这些在深度学习计算中大量使用。
通过专注于AI关注的运算,计算机的速度可以提高100倍以上!
加速的计算革命已经取得了巨大的飞跃。
来源和详细信息:
https://www.nvidia.com/en-us/data-center/h100/

