图灵汇消息显示,天风国际分析师郭明在2月5日的文章中提到,由于DeepSeek的走红,端侧AI技术正在迅速发展。DeepSeek的流行不仅增加了对英伟达H100芯片的需求,还表明优化训练方法能够有效降低成本,这反过来刺激了市场需求,也凸显了CUDA生态的优势。
郭明预测,到2026年,台积电和英伟达认为端侧AI将进入快速增长期。台积电在财报会议上称,2026年将是端侧AI发展的关键节点,而英伟达计划在2025年底到2026年上半年推出AI PC芯片N1X/N1。
DeepSeek的流行加快了端侧AI的进步。它提升了英伟达H100的训练需求,也带动了本地大型模型(LLM)的应用热潮。DeepSeek R1通过改进训练方法,在本地设备上显著提升了中小型LLM的表现。此外,用户对云数据安全的关注也推动了这一趋势。预计未来会有更多类似的开源模型出现,进一步推动本地LLM生态的成长。
目前,常见的本地DeepSeek部署方式包括使用LM Studio简化部署流程,借助Ollama运行模型,以及利用4-bit/8-bit量化技术减少显存占用,同时保持性能。模型参数规模从15亿到700亿不等,硬件配置则覆盖从低端笔记本到搭载英伟达独立显卡的高端PC。
现阶段,本地DeepSeek的部署尚处于初期阶段,对英伟达云端AI芯片的需求影响较小。但从长远看,尽管终端计算可能部分替代云计算,但也可能催生新的云端需求,类似于H100的情况。端侧AI和云计算预计会共同增长,并逐渐形成一个整合的AI体系。
虽然云计算长期仍有发展空间,但端侧AI的发展速度比预期更快,可能导致云计算短期内的增长低于市场预期,进而影响投资者信心。未来,可能缓解云计算增长不确定性的问题包括GB200 NVL72实现规模化生产,以及AI在机器人、自动驾驶和多模态领域的商业化进程更加清晰。
对台积电和英伟达来说,台积电将持续从端侧AI发展中获益(主要来自芯片升级),而英伟达在端侧AI市场的竞争压力可能大于云计算市场,这可能影响其短期投资信心。