热点:

    成本打到6万以下手把手教你用4路锐炫™显卡+至强®W跑DeepSeek

      [  品牌资讯   ]  

    凭借卓越性能表现与先天开源优势,DeepSeek正迅速成为全球扩展大模型应用实践的一大“圆心”。作为英特尔在GPU领域的重要布局,英特尔锐炫™显卡既是游戏党与视频生产力工作者的新欢,也可用作计算卡,对DeepSeek提供加速支持,为企业用户部署相关AI应用提供一条全新的高价性比实现路径。具体来说,就是与英特尔®至强®可扩展处理器或英特尔®至强®W处理器搭配,以多卡配置的型态来运行和加速DeepSeek推理任务。

    本文将在DeepSeek-R1-Distill-Qwen-32B推理场景下,以面向企业级应用且成本可控制在5-6万元人民币的4路英特尔锐炫™A770显卡+至强®W处理器的解决方案为例,详细阐述搭建硬件环境、配置驱动软件、优化参数设置等步骤,手把手教大家部署和配置这一方案。

    1.软硬件安装配置与初始化

    1.1硬件安装配置

    硬件配置

    处理器:英特尔®至强®W 处理器(可选20核/24核/28核/32核)

    内存:8x 32GB DDR5-3200

    存储:2TBM.2 固态盘

    电源:≥2000瓦

    GPU:4x英特尔锐炫™A770显卡

    BIOS:设置Re-SizeBAR Support为[Enabled]

    成本打到6万以下手把手教你用4路锐炫™显卡+至强®W跑DeepSeek

    图.安装4路英特尔锐炫™A770显卡的AI工作站

    在BIOS设置中,将Re-SizeBAR Support设为[Enabled]

    成本打到6万以下手把手教你用4路锐炫™显卡+至强®W跑DeepSeek

    1.2软件安装配置

    软件配置

    操作系统:Ubuntu22.04.1LTS

    内核:6.5.0- 35 - general

    驱动程序:23.43.27642.67

    vLLMServing:intelanalytics/ipex-llm-serving-xpu:b11

    安装操作系统Ubuntu22.04.1LTS。

    进行硬件验证,你要为每块GPU显卡都配备足额功耗来保证其工作正常。安装完操作系统后,可通过以下命令检查英特尔锐炫™A770显卡是否正常加载:

    ~\$lspci | grep 56a0

    18:00.0VGA compatible controller: Intel Corporation Device 56a0 (rev 08)

    36:00.0VGA compatible controller: Intel Corporation Device 56a0 (rev 08)

    54:00.0VGA compatible controller: Intel Corporation Device 56a0 (rev 08)

    cc:00.0VGA compatible controller: Intel Corporation Device 56a0 (rev 08)

    如果内核版本不是6.5.0-35,则通过以下命令安装6.5.0-35版本:

    ~\$sudo apt-get install -y linux-image-6.5.0-35-genericlinux-headers-6.5.0-35-generic linux-modules-6.5.0-35-genericlinux-modules-extra-6.5.0-35-generic

    ~\$sudo apt install intel-i915-dkms

    ~\$sudo vim /etc/default/grub

    GRUB_DEFAULT="Advancedoptions for Ubuntu>Ubuntu, with Linux 6.5.0-35-generic"

    ~\$sudo update-grub

    ~\$sudo reboot

    然后通过以下命令安装计算、媒体和显示运行时库:

    ~\$sudo apt install -y intel-opencl-icd intel-level-zero-gpu level-zerointel-media-va-driver-non-free libmfx1 libmfxgen1 libvpl2libegl-mesa0 libegl1-mesa libegl1-mesa-dev libgbm1 libgl1-mesa-devlibgl1-mesa-dri libglapi-mesa libgles2-mesa-dev libglx-mesa0libigdgmm12 libxatracker2 mesa-va-drivers mesa-vdpau-driversmesa-vulkan-drivers va-driver-all vainfo hwinfo clinfo

    通过以下命令将当前用户添加到render组:

    ~\$sudo gpasswd -a \$(USER) render

    ~\$sudo newgrp render

    驱动程序安装完成后,建议使用以下命令进行验证:

    ~\$clinfo | grep "Driver Version"

    DriverVersion 23.43.27642.67

    1.3在英特尔®至强®W平台上设置GPU的HDMI显示

    首先禁用ast卡:

    ~\$sudo vim /etc/modprobe.d/blacklist.conf

    在文件底部添加“blacklistast”:

    ~\$sudo update-initramfs -u

    然后将窗口系统配置为wayland模式:

    ~\$sudo vim /etc/gdm3/custom.conf

    将WaylandEnable设置为true:

    成本打到6万以下手把手教你用4路锐炫™显卡+至强®W跑DeepSeek

    完成后更新初始RAM文件系统(initramfs)并重启系统,然后将HDMI线插入第一块英特尔锐炫™A770显卡即可完成显示终端设置。

    ]#sudo update-initramfs -u

    ~\$sudo reboot

    1.4监控工具xpu-smi安装

    结果显示如下:

    成本打到6万以下手把手教你用4路锐炫™显卡+至强®W跑DeepSeek

    大模型服务与聊天机器人演示

    2.1容器(Docker)安装及服务设置

    用户可通过Docker,在英特尔锐炫™A770显卡上使用IPEX-LLM开展vLLM服务。

    通过以下命令,设置CPU主频至最大睿频,并将显卡锁频至2.4GHz:

    ~\$apt-get install linux-tools-6.5.0-35-genericlinux-cloud-tools-6.5.0-35-generic

    #Query max turbo frequency, like W3445, Max Turbo Frequency is 4.8GHz:

    ~\$sudo cpupower frequency-set -d 4.8GHz

    ~\$sudo xpu-smi config -d 0 -t 0 --frequencyrange 2400,2400

    ~\$sudo xpu-smi config -d 1 -t 0 --frequencyrange 2400,2400

    ~\$sudo xpu-smi config -d 2 -t 0 --frequencyrange 2400,2400

    ~\$sudo xpu-smi config -d 3 -t 0 --frequencyrange 2400,2400

    2.2安装并启动vLLM服务

    下载并安装以下vllm版本:

    ~\$docker pull intelanalytics/ipex-llm-serving-xpu:2.2.0-b11

    成本打到6万以下手把手教你用4路锐炫™显卡+至强®W跑DeepSeek

    将以下脚本放入/home/intel/Demo-4xArc中的bachkend-ipex-docker.sh文件(以下操作都以DeepSeek-R1-Distill-Qwen-32B版为例):

    成本打到6万以下手把手教你用4路锐炫™显卡+至强®W跑DeepSeek

    将以下脚本放入vllm-deepseek-r1-distill-qwen-32b-openaikey.sh文件:

    成本打到6万以下手把手教你用4路锐炫™显卡+至强®W跑DeepSeek

    然后启动容器和vLLM服务:

    ~\$sudo bash backend-ipex-docker.sh

    ~\$docker exec -it ipex-llm-b11 bash

    ~\$cd workspace & bashvllm-deepseek-r1-distill-qwen-32b-openaikey.sh

    如下日志表明DeepSeek推理服务已启动成功:

    成本打到6万以下手把手教你用4路锐炫™显卡+至强®W跑DeepSeek

    2.3使用ChatboxAI进行性能测试

    开发者可以在本地使用ChatboxAI进行LLM推理性能测试。如DeepSeek推理服务IP为192.168.10.110,在WindowsPowerShell中执行以下命令并输入密码,将远程服务端口映射到本地:

    成本打到6万以下手把手教你用4路锐炫™显卡+至强®W跑DeepSeek

    User>ssh-L 8001:localhost:8001 worker@192.168.10.110

    打开ChatboxAI的Url(https://web.chatboxai.app/)

    成本打到6万以下手把手教你用4路锐炫™显卡+至强®W跑DeepSeek

    选择“UserMy Own API Key / Local Model”,点击“AddCustom Provider”,并根据下图所示进行配置,手动输入DeepSeek整流的模型名称等信息:

    成本打到6万以下手把手教你用4路锐炫™显卡+至强®W跑DeepSeek

    成本打到6万以下手把手教你用4路锐炫™显卡+至强®W跑DeepSeek

    由此,使用者可以在ChatboxAI中向大语言模型提问,测试其推理性能:

    成本打到6万以下手把手教你用4路锐炫™显卡+至强®W跑DeepSeek

    vllm服务日志能够显示当前的性能状况,如图中所示,基于多路英特尔锐炫™A770显卡的推理服务一直有着30+tokens/s的性能表现。

    成本打到6万以下手把手教你用4路锐炫™显卡+至强®W跑DeepSeek

    创新不止步:全新24GB锐炫™显卡与满血版DeepSeekR1方案正在路上

    本部署指南虽然是围绕4路英特尔锐炫™A770显卡的方案展开,且以DeepSeek-R1-Distill-Qwen-32B版为例,但我们的实践探索并未局限于此。

    一方面,该解决方案可对DeepSeek各个蒸馏版提供同样灵活的支持。使用者可通过调整输入模型名称,以及设定并行使用的显卡数量来进行调整(使用--tensor-parallel-size参数来控制)。

    成本打到6万以下手把手教你用4路锐炫™显卡+至强®W跑DeepSeek

    另一方面,多路英特尔锐炫™显卡+英特尔®至强®可扩展处理器/至强®W处理器方案的关键目标,还是锁定在DeepSeek-R1-671B这一性能巅峰版本上,其配置与优化方法很快就会与大家见面。预计其技术路径会同时覆盖基于KTransformer,能更充分发挥至强®处理器内置AI加速技术AMX潜能的方案,以及GPU配置密度更高的单机16路英特尔锐炫™显卡的方案。

    另一个值得期待的进展,就是专为生产力应用打造的新一代英特尔锐炫™显卡 B58024G显存版本也正向我们走来,其4张卡即可提供96GB的显存容量,意味着用户可在单机中更轻松地部署更大参数量的DeepSeek服务(例如DeepSeek-R1-671B版本),进而能在实战中以较低的成本和较为便捷的部署方式,开启不缩水的DeepSeek服务。

    (免责声明:本文为本网站出于传播商业信息之目的进行转载发布,不代表本网站的观点及立场。本文所涉文、图、音视频等资料之一切权力和法律责任归材料提供方所有和承担。本网站对此咨询文字、图片等所有信息的真实性不作任何保证或承诺,亦不构成任何购买、投资等建议,据此操作者风险自担。)

    news.zol.com.cn true https://news.zol.com.cn/956/9566341.html report 5971 凭借卓越性能表现与先天开源优势,DeepSeek正迅速成为全球扩展大模型应用实践的一大“圆心”。作为英特尔在GPU领域的重要布局,英特尔锐炫™显卡既是游戏党与视频生产力工作者的新欢,也可用作计算卡,对DeepSeek提供加速支持,为企业用户部署相关AI应用提供一条全新的高...
    • 猜你喜欢
    • 最新
    • 精选
    • 相关
    推荐问答
    提问
    0

    下载ZOL APP
    秒看最新热品

    内容纠错