|
大家好,我是 Ai 學(xué)習(xí)的老章 DeepSeek-OCR 開源有段時(shí)間了,我曾詳細(xì)測試過DeepSeek 最新開源 OCR 模型,實(shí)測,也推薦過基于它的 web 端應(yīng)用:一個(gè)強(qiáng)大的開源 OCR 工具,基于 DeepSeek OCR,還有一個(gè)桌面客戶端:DeepSeek-OCR 桌面客戶端,Windows 用戶優(yōu)先體驗(yàn) ![]() DeepSeek-OCR 官方項(xiàng)目 README: 但是,vLLM 自 0.11.1 之后默認(rèn) CUDA 更新到了 12.9,我的 Linux 算力測試機(jī)還是 12.4,本文就介紹一下不重啟情況下,如何升級(jí) CUDA 和 vLLM@0.11.2,后面一篇文章再詳細(xì)介紹 DeepSeek-OCR 的部署和 API 使用。 CUDA 升級(jí)第一步:下載 CUDA Toolkit runfile目前 CUDA Toolkit 的最新版是 13.0,作為等等派,我還是先裝 12.9.1 吧 下載地址: 注意選擇符合自己操作系統(tǒng)、架構(gòu)、版本的安裝包,最后一項(xiàng)建議選 runfile(local) ![]() CUDA Toolkit 的歷史版本,可以在這里找到: ![]() 如果你的服務(wù)器是離線的,把下載好的 runfile 傳進(jìn)去即可 第二步:卸載舊版 CUDA可以通過 ![]() 然后進(jìn)入到 ![]() 直接運(yùn)行 一般很快就 OK 了 ![]() 第三步:安裝 CUDA Toolkit 12.9進(jìn)入到第一步下載好的 runfile 目錄下 運(yùn)行 然后選中以下幾項(xiàng),選中 Install 后 Enter ![]() 然后輸入 accept 后 Enter ![]() 無比順利情況下你會(huì)看到這個(gè)界面,這就約等于大功告成了 ![]() 但是!不出意外的話,肯定會(huì)出意外了 問題 1:nvidia-uvm你的服務(wù)器如果還有大模型在跑或別的任何服務(wù)在使用算力,極有可能會(huì)收到安裝失敗的 erro 查看日志發(fā)現(xiàn)有一個(gè)叫 nvidia-uvm 的內(nèi)核正在使用 ![]() 運(yùn)行 ![]() 這里情況也能不一樣,就我這個(gè),測試發(fā)現(xiàn)要完全停掉 docker 僅此命令還不夠 要徹底停止 Docker,需要同時(shí)停止服務(wù)和套接字
然后停掉自啟
完成升級(jí)后記得要 enable 一下
問題 2:nvidia-drm再次升級(jí) CUDA,又失敗了,日志提示 這里需要切換到純文本模式(關(guān)閉圖形界面) 執(zhí)行: 執(zhí)行后,等待幾秒鐘,讓圖形服務(wù)完全關(guān)閉。 然后再再次升級(jí) CUDA,就 OK 了 ![]() 執(zhí)行 ![]() 執(zhí)行 nvcc -V 發(fā)現(xiàn)報(bào)錯(cuò),這是因?yàn)榄h(huán)境變量還沒修改 執(zhí)行 ![]() 然后 再次執(zhí)行 ![]() vLLM 升級(jí)有網(wǎng)環(huán)境可以 pip upgrade,不過我這是內(nèi)網(wǎng)服務(wù)器 所以用了 vLLM 的官方 Docker 鏡像 ![]() 很簡單,直接 然后 把鏡像保存到本地后傳入內(nèi)網(wǎng)服務(wù)器即可 至此 vLLM 升級(jí)完成 部署 DeepSeek-OCR后面就是用 VLLM 的 Docker 拉起 DeepSeek-OCR 了 ![]() 測試很 OK,單卡 4090 很順暢,具體步驟就要下文了 ![]() |
|
|