实践分享：青云科技KubeSphere 上部署 AI 大模型管理工具 Ollama_图灵汇

投稿
APP
微信扫一扫获取更多

实践分享：青云科技KubeSphere 上部署 AI 大模型管理工具 Ollama

王晴

2024-07-10 00:00:00

图灵汇官网

在当今快速发展的人工智能领域，计算资源尤其是GPU资源的需求日益增长。对于运维工程师来说，掌握在Kubernetes集群中管理和配置GPU资源的技能变得至关重要。本文将介绍在KubeSphere平台上，利用Kubernetes的生态和工具，实现GPU资源的高效管理和应用部署。

核心议题概览：

集群扩展与GPU节点整合：通过KubeKey工具，为AI应用提供硬件支持，扩展Kubernetes集群并集成具备GPU能力的节点。
GPU资源的Kubernetes集成：利用Helm安装NVIDIA GPU Operator，简化GPU资源的调用和管理。
实战部署Ollama：在KubeSphere上部署专为AI大模型设计的管理工具Ollama，验证GPU资源的调度和使用效率。

实验环境配置：

操作系统：openEuler 22.03 LTS SP3 x86_64
KubeSphere：v3.4.1
Kubernetes：v1.28.8
KubeKey：v3.1.1
Containerd：1.7.13
NVIDIA GPU Operator：v24.3.0
NVIDIA 显卡驱动：550.54.15

实践步骤：

准备GPU Worker节点：使用入门级GPU显卡的虚拟机作为集群Worker节点，尽管性能不及高端型号，但足以满足学习和开发需求。
操作系统初始化：根据指南完成openEuler系统的初始化配置，并确保系统升级。
使用KubeKey扩容GPU节点：通过修改配置文件和执行命令，将GPU节点加入现有Kubernetes集群。
验证集群状态：通过KubeSphere控制台和kubectl命令行，检查集群节点信息和状态。
安装NVIDIA GPU Operator：手动安装显卡驱动，并使用Helm安装GPU Operator，实现GPU资源的调度和管理。
GPU功能验证测试：通过CUDA示例测试，验证Kubernetes集群是否能正确创建和使用GPU资源的Pod。
KubeSphere部署Ollama：结合实际需求，在K8s集群上部署Ollama，进行大模型管理。

自动化工具：

文章中所有操作步骤已编排为自动化脚本，包括NVIDIA GPU Operator的离线部署配置和Ansible自动化配置工具。

通过本文的学习，您将掌握在云原生环境中管理GPU资源的知识和技巧，为AI应用的快速发展提供支持。

青云 KubeSphere 部署模型实践工具 Ollama 分享管理科技

本文来源：图灵汇文章作者：王晴

: 让企业摸着“京东”过河，解密京东云言犀AI，最接地气的数智供应链答案
图灵汇

: 海尔智家邓邱伟：一个“智家大脑”如何颠覆智能家居体验？
图灵汇

: 突发机器人龙头曝大幅裁员，CEO公开发话行业凛冬将至！
图灵汇

: 阿里达摩院田彪：如何用“模组化”解决AI语音场景“碎片化”痛点？
图灵汇

: 暌违四年，优傲新品重新“定义”协作机器人
图灵汇

: 谷歌 AI 搜索功能被指冲击新闻出版商流量：未经许可提取内容 + 低链接率
图灵汇

: 谷歌发布安卓 16 QPR1 Beta 2 更新：Pixel 8/9 系列手机支持桌面模式、为平板引入窗口化功能
图灵汇

: 谷歌安卓 16 窗口化新规：功能仅限平板，折叠手机体验需外接屏幕
图灵汇

: 苹果更新 iOS 26 / iPadOS 26 / macOS Tahoe 26 设计资源，助力开发者快速适配“液态玻璃”视觉风格
图灵汇

: 苹果更新 iOS 26 / iPadOS 26 / macOS Tahoe 26 设计资源，助力开发者快速适配“液态玻璃”视觉风格
图灵汇

下一篇

麒麟软件携手希沃，共绘教育网信发展新篇章

杜小含

2024-07-10

2601