All in深度学习！辉达黄仁勋于GTC宣布软硬体全面升级

投稿
APP
微信扫一扫获取更多

All in深度学习！辉达黄仁勋于GTC宣布软硬体全面升级

陈平

2018-03-29 11:49:11

图灵汇官网

NVIDIA在GPU Technology Conference的深度学习与硬体升级

深度学习与股价增长

在GPU Technology Conference（GTC）的舞台上，NVIDIA，以其在人工智能领域的领导地位，展示了其在深度学习领域的最新应用及硬体升级，进一步推动了股价的攀升。自去年以来，深度学习市场经历了显著的发展，NVIDIA 创始人兼执行长黄仁勋在此次活动中揭示了一系列前沿的深度学习应用，涵盖医疗影像分析、智慧制造、自动化拣货、安全监控等多个领域。

硬体与软件的全面升级

NVIDIA 在GTC上推出了基于Volta架构的全新显示卡Quadro GV100，该款产品不仅配备了32GB的高速内存，还支持NVLINK 2.0，实现多GPU之间的高效协同，最高可达64GB的内存扩展能力。此款显示卡广泛应用于游戏、媒体与娱乐、产品设计与建筑等行业，其每年处理的影像帧数以数十亿计。

Volta架构的硬体革新与NVSwitch技术

NVIDIA在去年的基础上，继续深化Volta架构的硬体性能，引入了针对人工智能优化的Tensor Core，以满足市场对深度学习模型处理能力的需求。Tesla V100 GPU的内存容量提升至32GB，以应对高效率运算对大容量内存的迫切需求。预计IBM、Supermicro、HPE、联想、Cray、Tyan等主要服务器供应商将于2018年第二季度推出支持Tesla V100的产品，而Oracle Cloud Infrastructure也计划在下半年提供相应的服务。

NVLink 2.0与NVSwitch的创新

NVIDIA针对NVLink 2.0协议进行了升级，新增了交换器（NVSwitch）功能，该功能不仅增强了协议的带宽，还采用了类似互联网或主机上的多端口交换解决方案，以提高GPU间的通讯效率。台积电12纳米FFN制程工艺的新交换器装置，允许16颗GPU以2.4TB/s的速度进行数据交换，从而加速了神经网络的训练过程。

DGX产品的扩展与定价

NVIDIA推出了一款名为DGX-2的数据中心级产品，搭载了16组Tesla V100 GPU，相比DGX-1提升了两倍的计算能力。在Facebook Research的测试中，使用基于Torch架构的神经机器翻译工具集fairseq，DGX-2展现出比DGX-1高出10倍的性能。NVIDIA的DGX产品线包括了DGX-2（定价399,000美元）、DGX-1（定价149,000美元）以及DGX Station（定价68,000美元），强调“买得多，省得多”的策略。

跨平台的GPU Cloud服务

NVIDIA的GPU Cloud服务在近期进行了重大升级，全面支持Kubernetes，并扩展到了AWS、GCP、阿里云、Oracle Cloud等多个云平台，支持深度学习、高性能计算等框架。

PLASTER理论与深度学习应用评估

黄仁勋提出了PLASTER理论，用于评估深度学习系统在商业应用中的综合能力，包括可编程性、服务响应速度、模型应用精确度、神经网络模型大小、资料中心运算力、能量效率以及训练、推理、部署的速度。

TensorRT 4的发布与深度学习推论优化

NVIDIA发布了TensorRT 4，该版本适用于数据中心、嵌入式系统和车载终端，能够加速多GPU神经网络的训练、验证和部署。TensorRT 4与Google合作，整合TensorFlow 1.7，相比未优化GPU运算，可提升8倍性能。此外，TensorRT 4还支持ONNX框架，兼容MXNet、Caffe 2等主流深度学习开发框架，便于模型训练数据的快速交换。通过TensorRT 4，开发者能够将最新的深度学习应用快速部署至终端自动驾驶系统，如NVIDIA DRIVE或NVIDIA Jetson，支持16位半精度（FP16）或8位整数（INT8）精度的快速布署。