首页
/ 正文

ollama docker（长文讲解）

更新时间: 2025-03-16 12:25:18

💡一则或许对你有用的小广告

欢迎加入小哈的星球 ，你将获得：专属的项目实战(已更新的所有项目都能学习) / 1v1 提问 / Java 学习路线 / 学习打卡 / 每月赠书 / 社群讨论

新开坑项目:《Spring AI 项目实战》 正在持续爆肝中，基于 Spring AI + Spring Boot 3.x + JDK 21...， 点击查看 ;

《从零手撸：仿小红书（微服务架构）》 已完结，基于 Spring Cloud Alibaba + Spring Boot 3.x + JDK 17...，点击查看项目介绍 ;演示链接： http://116.62.199.48:7070 ;

《从零手撸：前后端分离博客项目（全栈开发）》 2 期已完结，演示链接： http://116.62.199.48/ ;

截止目前，星球内专栏累计输出 100w+ 字，讲解图 4013+ 张，还在持续爆肝中.. 后续还会上新更多项目，目标是将 Java 领域典型的项目都整一波，如秒杀系统, 在线商城, IM 即时通讯，权限管理，Spring Cloud Alibaba 微服务等等，已有 3700+ 小伙伴加入学习，欢迎点击围观

在当今的 AI 开发领域，模型的部署和运行效率是开发者关注的核心问题之一。OLLAMA（Open Large Language Model Adapter）作为一个轻量级、高性能的本地大模型推理工具，与 Docker 的容器化技术相结合，为开发者提供了一种灵活且高效的解决方案。本文将从基础概念入手，逐步讲解如何通过 Docker 容器化部署 OLLAMA，结合实际案例演示其工作流程，并深入探讨进阶配置与常见问题。无论是编程初学者还是中级开发者，都能通过本文掌握这一技术组合的核心能力。

什么是 Docker？为什么需要它？

Docker 是一种容器化技术，它允许开发者将应用程序及其依赖项打包到一个独立的容器中。这一过程类似于将货物装入标准化的集装箱：无论运输工具是卡车、轮船还是飞机，集装箱内的物品始终保持完整和一致。

Docker 的核心优势包括：

环境一致性：避免“在我的电脑上能运行”的尴尬，确保代码在不同环境中的表现一致。
资源隔离：每个容器拥有独立的文件系统、网络和进程空间，减少冲突风险。
快速部署：通过预构建的镜像（Image）快速启动服务，节省环境配置时间。

示例代码：拉取并运行一个简单的 Nginx 容器

docker run -d -p 80:80 --name my-nginx nginx

这条命令会从 Docker Hub 下载 Nginx 镜像，启动容器，并将本地 80 端口映射到容器内的 80 端口。

OLLAMA：本地大模型的“智能助手”

OLLAMA 是一个专注于本地大模型推理的开源工具，它允许开发者在本地快速部署和运行 LLM（Large Language Model）或其他复杂模型。其核心特点包括：

轻量级：仅需几十 MB 的基础镜像，模型下载和加载速度极快。
模型即服务：通过 API 接口直接调用模型，无需编写复杂的推理代码。
支持主流模型：如 Llama、Stable Diffusion、Qwen 等。

OLLAMA 的典型使用场景：

开发者需要快速测试模型推理效果，但不想配置复杂的深度学习环境。
企业希望在私有环境中部署模型，避免依赖云端服务。

在 Docker 中部署 OLLAMA：分步指南

步骤 1：安装 Docker

首先，确保本地已安装 Docker。以 Ubuntu 系统为例：

sudo apt-get update  
sudo apt-get install docker.io

步骤 2：拉取 OLLAMA 镜像

使用 Docker Hub 中的官方 OLLAMA 镜像：

docker pull ollama/ollama:latest

步骤 3：运行 OLLAMA 容器

通过 docker run 命令启动容器，并挂载本地目录以持久化模型文件：

docker run -d \  
  -p 11434:11434 \  # 将容器的 11434 端口映射到本地  
  -v $HOME/.ollama:/root/.ollama \  # 挂载模型存储目录  
  --name ollama-container \  
  ollama/ollama:latest

步骤 4：安装并使用模型

进入运行中的容器，安装目标模型（例如 Llama 3）：

docker exec -it ollama-container ollama install llama3

安装完成后，可通过 API 调用模型：

curl -X POST \  
  -H "Content-Type: application/json" \  
  -d '{"prompt": "写一个关于夏天的五言绝句"}' \  
  http://localhost:11434/models/llama3

实战案例：部署一个文本生成服务

需求背景

假设我们需要快速搭建一个本地文本生成服务，供 Web 应用调用。

实现步骤

编写 Dockerfile：自定义镜像以集成 OLLAMA 和 Nginx

FROM ollama/ollama:latest  

RUN apt-get update && apt-get install -y nginx  

COPY nginx.conf /etc/nginx/nginx.conf  

EXPOSE 80 11434  

CMD ["sh", "-c", "nginx && ollama start"]

配置 Nginx 反向代理（nginx.conf 片段）：

http {  
    upstream ollama_api {  
        server 127.0.0.1:11434;  
    }  

    server {  
        listen 80;  
        location /api/ {  
            proxy_pass http://ollama_api;  
        }  
    }  
}

构建并运行容器：

docker build -t my-ollama-service .  
docker run -d -p 80:80 --name my-service my-ollama-service

测试服务：

curl -X POST \  
  -H "Content-Type: application/json" \  
  -d '{"prompt": "描述一下人工智能的未来"}' \  
  http://localhost/api/models/llama3

进阶配置与优化

持久化存储与数据安全

在 docker run 命令中，通过 -v 参数挂载本地目录，确保模型数据不因容器重启而丢失：

-v $HOME/ollama_data:/root/.ollama \

网络与性能调优

限制 CPU/Memory：
```
--cpus="2" --memory="4g"  
```
使用 GPU 加速（需 NVIDIA 驱动支持）：
```
--gpus all  
```

常见问题与解决方案

Q1：模型下载失败或超时

可能原因：网络不稳定或镜像源受限。
解决方案：

docker run ... \  
  -e OLLAMA_MIRROR=https://mirror.ollama.cn \  
  ...

Q2：端口冲突

现象：启动容器时提示端口已被占用。
解决方法：

docker run ... -p 11435:11434 ...

结论

通过本文的讲解，读者已掌握了 OLLAMA Docker 的核心概念、部署方法及实际应用案例。这种技术组合不仅降低了大模型的本地化部署门槛，还通过容器化技术保障了环境的一致性和可移植性。无论是开发原型、测试模型性能，还是构建生产级服务，OLLAMA 与 Docker 的结合都能提供高效且灵活的解决方案。未来，随着模型体积和复杂度的持续增长，这种轻量化、模块化的部署方式将成为 AI 开发的主流趋势。

希望本文能帮助开发者快速上手这一技术栈，并激发更多创新应用场景的探索！

ollama docker（长文讲解）

什么是 Docker？为什么需要它？

OLLAMA：本地大模型的“智能助手”

在 Docker 中部署 OLLAMA：分步指南

步骤 1：安装 Docker

步骤 2：拉取 OLLAMA 镜像

步骤 3：运行 OLLAMA 容器

步骤 4：安装并使用模型

实战案例：部署一个文本生成服务

需求背景

实现步骤

进阶配置与优化

持久化存储与数据安全

网络与性能调优

常见问题与解决方案

Q1：模型下载失败或超时

Q2：端口冲突

结论

最新发布

Pycharm 2025.2.2 最新激活码,破解版安装教程（亲测至2099年~）

Rider 2025.2.2 最新破解版安装教程（附激活码,亲测至2099年~）

RubyMine 2025.2.2 最新破解版安装教程（附激活码,亲测至2099年~）

Clion 2025.2.2 最新激活码，破解版安装教程（亲测至2099年~）

GoLand 2025.2.2 最新激活码,破解版安装教程（亲测至2099年~）

Webstorm 2025.2.2 最新激活码,破解版安装教程（亲测至2099年~）

PhpStorm 2025.2.2 最新激活码,破解版安装教程（亲测至2099年~）

IDEA 2025.2.2 最新激活码,破解版安装教程（亲测至2099年~）

DataGrip 2025.2.3 最新激活码,破解版安装教程（亲测至2099年~）

Webstorm 2025.2.1 最新激活码,破解版安装教程（亲测至2099年~）