All in深度学习!辉达黄仁勋于GTC宣布软硬体全面升级

图灵汇官网

NVIDIA在GPU Technology Conference的深度学习与硬体升级

深度学习与股价增长

在GPU Technology Conference(GTC)的舞台上,NVIDIA,以其在人工智能领域的领导地位,展示了其在深度学习领域的最新应用及硬体升级,进一步推动了股价的攀升。自去年以来,深度学习市场经历了显著的发展,NVIDIA 创始人兼执行长黄仁勋在此次活动中揭示了一系列前沿的深度学习应用,涵盖医疗影像分析、智慧制造、自动化拣货、安全监控等多个领域。

硬体与软件的全面升级

NVIDIA 在GTC上推出了基于Volta架构的全新显示卡Quadro GV100,该款产品不仅配备了32GB的高速内存,还支持NVLINK 2.0,实现多GPU之间的高效协同,最高可达64GB的内存扩展能力。此款显示卡广泛应用于游戏、媒体与娱乐、产品设计与建筑等行业,其每年处理的影像帧数以数十亿计。

Volta架构的硬体革新与NVSwitch技术

NVIDIA在去年的基础上,继续深化Volta架构的硬体性能,引入Tensor Core以满足人工智能运算的需求。在市场对深度学习模型处理能力持续增长的需求下,Tesla V100 GPU的内存容量提升至32GB,以缓解高效能运算对内存的高需求。此外,NVIDIA针对CPU与GPU间的工作分配进行了优化,通过升级NVLink 2.0协议,实现了300GB/s的传输速度,引入了名为NVSwitch的创新交换技术,允许16颗GPU以2.4TB/s的速度进行资料交换,从而加速神经网络的训练过程。

软件生态系统的扩展

为配合硬件的升级,NVIDIA的软件生态系统也得到了显著增强。GPU Cloud平台全面支持Kubernetes,并覆盖了AWS、GCP、阿里云与Oracle云等主流云端运算服务,以支持深度学习、高效能运算等框架的广泛应用。黄仁勋提出了PLASTER理论,用于评估深度学习系统的整合能力,包括可程式化能力、服务反应速度、模型应用精确度、神经网络模型大小、生产总量、能量效率以及学习速率等关键指标。

TensorRT 4的发布与深度学习应用优化

NVIDIA宣布了TensorRT 4的发布,这款工具能够加速在资料中心、嵌入式系统与汽车终端设备上运行的神经网络训练过程。与Google合作,TensorRT 4整合了TensorFlow 1.7,相较于未优化的GPU运算,性能提升可达8倍。此外,TensorRT 4还支持ONNX框架,促进了使用MXNet、PyTorch、Caffe 2等主流深度学习开发框架的模型交换。开发者可以利用TensorRT 4快速部署深度学习推论应用,如神经机器翻译、自动语音识别、语音合成与推荐系统等,支持16位半精确度(FP16)或8位整数(INT8)精度的模型部署至终端设备。

结语

NVIDIA通过在硬体和软件层面的全面升级,展现了其在深度学习领域的领先地位,为市场带来了更强大的计算能力与更丰富的应用可能性。随着深度学习技术的不断演进,NVIDIA正引领着行业向更加智能、高效的未来迈进。

本文来源: 人工智能学习网 文章作者: 马飞超