首页
/ 正文

Ollama 相关命令（手把手讲解）

更新时间: 2025-04-13 15:35:32

💡一则或许对你有用的小广告

欢迎加入小哈的星球 ，你将获得：专属的项目实战(已更新的所有项目都能学习) / 1v1 提问 / Java 学习路线 / 学习打卡 / 每月赠书 / 社群讨论

新开坑项目:《Spring AI 项目实战》 正在持续爆肝中，基于 Spring AI + Spring Boot 3.x + JDK 21...， 点击查看 ;

《从零手撸：仿小红书（微服务架构）》 已完结，基于 Spring Cloud Alibaba + Spring Boot 3.x + JDK 17...，点击查看项目介绍 ;演示链接： http://116.62.199.48:7070 ;

《从零手撸：前后端分离博客项目（全栈开发）》 2 期已完结，演示链接： http://116.62.199.48/ ;

截止目前，星球内专栏累计输出 90w+ 字，讲解图 3441+ 张，还在持续爆肝中.. 后续还会上新更多项目，目标是将 Java 领域典型的项目都整一波，如秒杀系统, 在线商城, IM 即时通讯，权限管理，Spring Cloud Alibaba 微服务等等，已有 3100+ 小伙伴加入学习，欢迎点击围观

前言

在人工智能技术快速发展的今天，本地化部署大语言模型（LLM）的需求日益增长。Ollama 是一个开源工具，允许开发者在本地快速运行、管理和调用各种大语言模型，同时提供轻量级、高效的命令行接口。无论是编程初学者尝试模型推理，还是中级开发者构建定制化应用，掌握 Ollama 相关命令 都是解锁其功能的关键。本文将通过循序渐进的方式，结合实际案例和代码示例，帮助读者理解并熟练使用 Ollama 的核心命令。

安装与配置：构建本地模型仓库的基石

安装 Ollama

Ollama 支持多种操作系统，安装过程简洁。以 Linux 为例：

curl -fsSL https://ollama.ai/install.sh | sh

此命令会自动下载并安装 Ollama，同时配置系统环境变量。对于 macOS 用户，可使用 Homebrew：

brew install ollama

安装完成后，通过 ollama version 验证是否成功。

初始化配置

Ollama 默认使用 ~/.ollama 目录存储模型和配置文件。若需自定义路径，可通过环境变量修改：

export OLLAMA_HOME=/path/to/ollama

此操作类似为模型仓库指定“物理地址”，方便后续管理。

基础命令：快速启动与模型管理

1. 运行模型推理

使用 ollama run 命令启动模型推理。例如，调用 Llama2 模型生成文本：

ollama run llama2 "请用一句话描述人工智能的未来。"

输出结果可能为：

"人工智能的未来将深度融合人类创造力，推动医疗、教育等领域的突破性进展。"

2. 列出可用模型

通过 ollama list 查看已下载的模型列表。若模型未下载，可使用 ollama pull 强制拉取：

ollama pull bloom

此命令类似于“从云端图书馆借阅书籍”，将模型文件保存到本地仓库。

3. 停止与重启服务

若需停止 Ollama 服务：

ollama stop

重启时，只需执行：

ollama start

高级命令：模型定制与性能优化

1. 自定义模型配置

Ollama 允许用户通过 config.toml 文件调整模型参数。例如，修改 llama2 的温度（temperature）参数以控制输出随机性：

[model.llama2]  
temperature = 0.8  
max_tokens = 256

保存配置后，重启 Ollama 使更改生效。

2. 模型版本管理

若需切换模型版本，使用 ollama pull 指定标签：

ollama pull qwen:1.5

这类似于“在软件仓库切换分支”，确保使用特定版本的模型。

3. API 接口调用

Ollama 内置 HTTP API，支持通过 curl 或代码调用模型。例如：

curl http://localhost:11434/generate -d '{"model":"llama2", "prompt":"解释量子计算"}'

此命令将返回结构化的 JSON 响应，适合集成到 Web 应用中。

命令进阶：日志与调试

查看运行日志

当模型推理异常时，通过 ollama logs 检查日志：

ollama logs --tail 100

该命令会输出最近 100 行日志，帮助定位内存不足或模型加载失败等问题。

清理冗余模型

若磁盘空间紧张，可删除不再需要的模型：

ollama rm qwen

此操作类似“清理书架上的旧书”，释放存储资源。

实战案例：构建个性化问答系统

场景描述

假设需要为公司内部知识库创建一个问答机器人，要求快速响应技术文档相关问题。

实现步骤

安装所需模型：
```
ollama pull qwen  
```

编写提示模板：
创建 qa_prompt.txt 文件，内容如下：

请根据以下文档内容回答用户问题：  
[文档内容]  
用户问题：{query}

编写脚本调用模型：
使用 Python 调用 Ollama 的 API：

import requests  

def ask_qwen(query, document):  
    prompt = open("qa_prompt.txt").read().replace("{query}", query)  
    data = {"model": "qwen", "prompt": prompt + "\n文档内容：" + document}  
    response = requests.post("http://localhost:11434/generate", json=data)  
    return response.json()["response"]  

# 示例调用  
document = "Ollama 支持多模型并行推理..."  
answer = ask_qwen("Ollama 如何支持多模型？", document)  
print(answer)

优化响应逻辑：
通过调整 config.toml 中的 top_p 参数，控制输出的多样性：
```
[model.qwen]  
top_p = 0.9  
```

常见问题与解决方案

问题 1：模型加载缓慢

原因：默认下载源可能受限，或模型文件损坏。
解决方法：

ollama pull qwen --mirror https://mirrors.aliyun.com/ollama/  

ollama rm qwen && ollama pull qwen

问题 2：API 请求超时

原因：防火墙或端口冲突。
解决方法：

netstat -tulpn | grep 11434  

[server]  
port = 8080

结论

通过掌握 Ollama 相关命令，开发者能够高效地在本地环境中部署、管理和调用大语言模型。从基础的 run 和 list，到进阶的 API 调用和模型配置，Ollama 提供了灵活且强大的工具链。无论是构建聊天机器人、文档分析系统，还是进行学术研究，Ollama 都能成为开发者的好帮手。未来，随着模型库的扩展和命令功能的增强，Ollama 的应用场景将更加广泛。建议读者结合实际项目持续实践，逐步深入探索其潜力。

Ollama 相关命令（手把手讲解）

前言

安装与配置：构建本地模型仓库的基石

安装 Ollama

初始化配置

基础命令：快速启动与模型管理

1. 运行模型推理

2. 列出可用模型

3. 停止与重启服务

高级命令：模型定制与性能优化

1. 自定义模型配置

2. 模型版本管理

3. API 接口调用

命令进阶：日志与调试

查看运行日志

清理冗余模型

实战案例：构建个性化问答系统

场景描述

实现步骤

常见问题与解决方案

问题 1：模型加载缓慢

问题 2：API 请求超时

结论

最新发布

RubyMine 2025.1.4.1 最新激活码，破解版安装教程（亲测有效~）

Clion 2025.1.4 最新激活码，破解版安装教程（至2099年~）

Pycharm 2025.1.3.1 最新激活码，破解版安装教程（至2099年~）

GoLand 2025.1.4 最新激活码，破解版安装教程（至2099年~）

PhpStorm 2025.1.4.1 最新激活码，破解版安装教程（亲测有效~）

Webstorm 2025.1.4.1 最新激活码，破解版安装教程（至2099年~）

IDEA 2025.1.4.1 最新激活码，破解版安装教程（至2099年~）

DBeaver 23.2 破解安装教程（附激活码，亲测有效~）

SQLyog Ultimate 破解版安装教程（附证书秘钥注册码）

Navicat 16 破解版安装教程_激活码(永久激活,亲测好用)