如何下载大模型并用llamafactory启动

doggie · 2026 年2 月 26 日 08:11

用modelscope下载模型

用python下载

# !pip install modelscope


from modelscope.hub.snapshot_download import snapshot_download
model_dir = snapshot_download(
    model_id='Qwen/Qwen3-8B',
    local_dir='/ubuntu-22.04/LLaMA-Factory/models/qwen3-8b',
    cache_dir='/ubuntu-22.04/LLaMA-Factory/models/qwen3-8b-cache')

用llamafactory加载模型

在终端启用

CUDA_VISIBLE_DEVICES=2,3 \
API_HOST=0.0.0.0 \
API_PORT=8001 \
API_KEY=sk-test\
llamafactory-cli api \
  --model_name_or_path /ubuntu-22.04/LLaMA-Factory/models/qwen3-8b \
  --template qwen \
  --finetuning_type lora \
  --trust_remote_code \
  --max_new_tokens 32768

用vllm加载模型

在终端启用

CUDA_VISIBLE_DEVICES=5 vllm  serve /ubuntu-22.04/LLaMA-Factory/models/qwen3-8b --port 8004 --host 0.0.0.0   --max-num-seqs 4 --max-model-len 4096 --served-model-name deepseek-ocr --gpu-memory-utilization 0.2

话题	回复	浏览量
Qwen2-VL-2B-Instruct Lora 微调 SwanLab可视化记录版（如何使用魔搭下载模型 🛠工具与编程	8	2025 年7 月 31 日
如何加速大模型的响应速度 💻编程大模型	5	2026 年1 月 12 日
如何将qwen3小模型和视觉模型拼接，进而为qwen3小模型提供视觉能力 🛠工具与编程	16	2025 年7 月 31 日
开源大模型食用指南 🤖人工智能大模型	15	2025 年7 月 23 日
如何安装部署deepseek-ocr且通过vllm server提供访问 🤖人工智能 ocr , deepseek	5	2026 年1 月 12 日

如何下载大模型并用llamafactory启动

用modelscope下载模型

用llamafactory加载模型

用vllm加载模型

相关话题