当前位置：首页 > news >正文

【vLLM】使用vLLM部署Qwen3-VL-30B-A3B-Instruct

news 2025/10/11 18:31:04

环境与设备配置：H20*8(96G)

MODEL_ID=Qwen/Qwen3-VL-30B-A3B-Instruct
MODEL_NAME=Qwen3-VL-30B-A3B-Instruct
python3 -m vllm.entrypoints.openai.api_server \--model  $MODEL_ID \--served-model-name $MODEL_NAME \--tensor-parallel-size 8 \--mm-encoder-tp-mode data \--limit-mm-per-prompt.video 0 \--mm-processor-cache-type shm \--enable-expert-parallel \--host 0.0.0.0 \--port 22002 \--dtype bfloat16 \--gpu-memory-utilization 0.75 \--quantization fp8 \--distributed-executor-backend mp

请求推理

http://www.hskmm.com/?act=detail&tid=28830

相关文章：

2025 屋顶防水维修/外墙防水维修/电梯井防水维修厂家推荐榜：专注全场景渗漏解决方案供应！

2025 流化床/GMP标准/实验室气流粉碎机厂家推荐榜：聚焦多行业粉碎需求，赋能高效生产！

2025年OPP涂布机源头厂家最新推荐榜：技术领先与市场口碑

【EBS】EBS系统新克隆环境的MRP无法运行

花纹铝板口碑推荐/铝板厂家推荐/铝板知名品牌

正则表达式详解

2025通风气楼厂家推荐：欧诺通风设备，高效节能品质之选

2025年湖南短视频代运营/拍摄/剪辑/方案策划/推广/引流/IP打造公司综合实力排行榜推荐

2025粉末涂料厂家推荐：财诺名荣，环保高效品质之选！

2025.10.11NOIP模拟

颠覆传统RAG！Agentic RAG登场，AI代理如何“自我进化”解决复杂 query？

在 Windows 下集成 Conda 与 VS Code 打造高效开发环境

洛谷题单指南-进阶数论-P2421 [NOI2002] 荒岛野人

2025粉末涂料厂家最新推荐榜：环保高效与色彩持久的行业佼佼

Idea摸鱼看小说插件(YsQy-Book)-免费使用

贴牛皮纸铝卷生产商推荐/铝卷生产厂家/铝卷哪家好

2025浇注型聚氨酯厂家口碑排行榜：品质与服务双优之选

RAFT 共识算法

2025氧化镁厂家最新推荐榜：高纯度与优质服务并重的行业先锋

contenteditable 深度交互教程

2025风机盘管厂家口碑推荐榜：高效节能与稳定性能的行业首选

痞子衡嵌入式：在i.MXRT下测试启动特性时可改写OTP Shadow寄存器而不烧OTP

直流微电网运行控制仿真算法设计与实现

基于MATLAB的多棵树分类器（随机森林）

车载360环视平台：米尔RK3576开发板支持12路低延迟推流

2025双氧水厂家最新推荐榜：品质卓越与环保安全的首选品牌！

TDengine 3.3.6.0 使用Docker部署3节点集群

05-字符设备驱动之ioctl