开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >专栏 >记录一次 vLLM 服务卡在模型加载的排查过程

记录一次 vLLM 服务卡在模型加载的排查过程

作者头像

goodgood_live

发布于 2026-05-21 20:05:28

发布于 2026-05-21 20:05:28

2570

举报

概述

这次记录的是一台云主机上的 GPU 测试机问题：模型权重放在 NAS，服务用 Docker 跑 vLLM。容器能启动，端口也能看到，但接口一直没有 ready，日志长时间停在模型加载附近。

文章被收录于专栏：Docker教程Docker教程

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

GPU 云服务器

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

GPU 云服务器

评论

登录后参与评论

0 条评论

热度

最新