当前位置: 首页 > news >正文

06.容器存储 - 教程

《Docker 数据管理全解析:从基础到实战》

一、Docker 核心概念回顾

在深入探讨数据管理之前,我们先简单回顾 Docker 的核心组件,这有助于理解后续的数据处理机制。

Docker 采用了客户端 - 服务器架构,主要包含三个部分:

容器的一个重要特性是临时性 - 当容器被删除时,其内部的数据也会随之消失。这就是为什么我们需要专门的数据管理策略来确保重要数据的持久化。

二、Docker 存储驱动深度解析

存储驱动是 Docker 实现容器分层文件系统的关键技术,它允许容器共享基础镜像的资源,同时拥有自己的读写层。

(一)常用存储驱动对比

存储驱动优势劣势适用场景
overlay2性能优秀,空间效率高对内核版本有要求 (≥4.0)大多数生产环境
devicemapper稳定性好,支持精简配置性能一般,配置复杂企业级稳定性要求高的场景
btrfs支持高效快照,适合大文件内存占用高需要频繁快照的场景
zfs数据完整性好,支持压缩配置复杂,资源消耗大数据完整性要求高的场景

(二)查看和设置存储驱动

查看当前 Docker 使用的存储驱动:

docker info | grep "Storage Driver"

修改存储驱动(需要重启 Docker 服务):

  1. 编辑 Docker 配置文件 /etc/docker/daemon.json
  2. 添加配置:
{
"storage-driver": "overlay2"
}
  1. 重启 Docker 服务:
sudo systemctl restart docker

三、数据卷详解

数据卷是绕过容器可写层的特殊目录,具有以下特性:

  • 数据卷可以在容器之间共享和重用
  • 对数据卷的修改会立即生效
  • 数据卷不会被容器删除而影响
  • 数据卷默认会一直存在,直到显式删除

(一)绑定挂载(Bind Mounts)

绑定挂载允许将主机上的任意文件或目录挂载到容器中,是最直接的数据共享方式。

基本用法

# 将主机的/path/on/host目录挂载到容器的/path/in/container目录
docker run -v /path/on/host:/path/in/container image_name

实战示例
假设我们开发一个 Python 应用,希望在容器中运行代码,同时在本地编辑代码能实时生效:

# 创建项目目录
mkdir python-app &&
cd python-app
echo "print('Hello Docker')" > app.py
# 运行容器并挂载当前目录
docker run -v $(pwd):/app -w /app python:3.9 python app.py

此时,修改本地的 app.py 文件,再次运行上述命令会看到更新后的结果。

(二)Docker 管理的数据卷

Docker 管理的数据卷由 Docker 后台自动创建和管理,存储在主机的/var/lib/docker/volumes/目录下。

常用命令

# 创建数据卷
docker volume create myvolume
# 查看所有数据卷
docker volume ls
# 查看数据卷详情
docker volume inspect myvolume
# 使用数据卷运行容器
docker run -v myvolume:/data image_name
# 删除未使用的数据卷
docker volume prune

实战示例:创建一个使用数据卷的 Nginx 容器,确保网站文件不会因容器删除而丢失:

# 创建数据卷
docker volume create nginx_data
# 启动Nginx容器并挂载数据卷
docker run -d -p 80:80 -v nginx_data:/usr/share/nginx/html --name mynginx nginx
# 复制HTML文件到数据卷(通过容器)
echo "<h1>Hello Docker Volume</h1>" > index.html
docker cp index.html mynginx:/usr/share/nginx/html/
# 测试访问
curl http://localhost

现在即使删除并重新创建容器,只要挂载相同的数据卷,网站内容依然存在。

四、高级数据共享策略

(一)多容器数据共享

1. 通过命名卷共享

创建一个命名卷,然后在多个容器中挂载它:

# 创建共享卷
docker volume create shared_data
# 启动第一个容器写入数据
docker run -v shared_data:/data --name writer alpine sh -c "echo 'shared content' > /data/file.txt && sleep 300"
# 启动第二个容器读取数据
docker run -v shared_data:/data --name reader alpine cat /data/file.txt
2. 使用数据卷容器(推荐用于 Docker 1.9 之前版本)

虽然现代 Docker 更推荐使用命名卷,但了解数据卷容器的概念仍有价值:

# 创建数据卷容器
docker create -v /shared --name data_container alpine
# 从数据卷容器挂载数据
docker run --volumes-from data_container --name app1 alpine
docker run --volumes-from data_container --name app2 alpine

(二)跨主机数据共享

对于需要跨主机共享数据的场景,可以考虑以下方案:

  1. NFS 共享存储
# 在主机上挂载NFS共享
sudo mount -t nfs server_ip:/nfs_share /local/path
# 在Docker中使用该目录作为绑定挂载
docker run -v /local/path:/container/path image_name
  1. 分布式存储系统:如 Ceph、GlusterFS 等,适合大规模部署。

五、数据卷备份与恢复

(一)备份数据卷

# 备份名为myvolume的数据卷到backup.tar
docker run --rm -v myvolume:/source -v $(pwd):/backup alpine tar -czvf /backup/backup.tar -C /source .

(二)恢复数据卷

# 创建新数据卷
docker volume create restored_volume
# 从备份文件恢复
docker run --rm -v restored_volume:/target -v $(pwd):/backup alpine sh -c "tar -xzvf /backup/backup.tar -C /target"

六、实战:构建持久化的 WordPress 站点

让我们通过一个完整实例,创建一个数据持久化的 WordPress 站点,包括 MySQL 数据库和 WordPress 应用。

  1. 创建网络
docker network create wordpress_network
  1. 创建 MySQL 容器
# 创建数据卷存储数据库
docker volume create mysql_data
# 启动MySQL容器
docker run -d \
--name wordpress_db \
--network wordpress_network \
-v mysql_data:/var/lib/mysql \
-e MYSQL_ROOT_PASSWORD=db_password \
-e MYSQL_DATABASE=wordpress \
-e MYSQL_USER=wp_user \
-e MYSQL_PASSWORD=wp_password \
mysql:8.0
  1. 创建 WordPress 容器
# 创建数据卷存储WordPress文件
docker volume create wordpress_data
# 启动WordPress容器
docker run -d \
--name wordpress \
--network wordpress_network \
-v wordpress_data:/var/www/html \
-p 8080:80 \
-e WORDPRESS_DB_HOST=wordpress_db \
-e WORDPRESS_DB_USER=wp_user \
-e WORDPRESS_DB_PASSWORD=wp_password \
-e WORDPRESS_DB_NAME=wordpress \
wordpress:latest
  1. 测试访问
    打开浏览器访问 http://localhost:8080,完成 WordPress 安装。
  2. 验证持久化
# 删除并重新创建容器
docker rm -f wordpress
docker run -d \
--name wordpress \
--network wordpress_network \
-v wordpress_data:/var/www/html \
-p 8080:80 \
-e WORDPRESS_DB_HOST=wordpress_db \
-e WORDPRESS_DB_USER=wp_user \
-e WORDPRESS_DB_PASSWORD=wp_password \
-e WORDPRESS_DB_NAME=wordpress \
wordpress:latest

再次访问 http://localhost:8080,你会发现之前的配置和内容都被保留了。

七、最佳实践与注意事项

  1. 选择合适的存储方式

    • 开发环境:优先使用绑定挂载,方便代码调试
    • 生产环境:优先使用 Docker 管理的数据卷,更安全可靠
  2. 数据卷安全

    • 定期备份重要数据卷
    • 限制数据卷的访问权限
    • 敏感数据避免使用数据卷,考虑使用 Docker Secrets
  3. 性能优化

    • 对于 I/O 密集型应用,选择高性能存储驱动(如 overlay2)
    • 避免在容器内频繁读写大量小文件
    • 考虑使用 tmpfs 挂载临时文件目录:docker run --tmpfs /tmp:size=100m image_name
  4. 清理无用数据

    # 清理未使用的数据卷
    docker volume prune
    # 清理所有未使用的资源(容器、镜像、网络、数据卷)
    docker system prune -a --volumes

通过本文的学习,你应该已经掌握了 Docker 数据管理的核心概念和实用技巧。合理运用这些知识,可以确保容器化应用的数据安全和持久化,为你的 Docker 实践打下坚实基础。

http://www.hskmm.com/?act=detail&tid=19206

相关文章:

  • 1748:约瑟夫问题
  • Ansible + Docker 部署 Apache Nifi 1.28 单用户集群
  • 候机的队伍
  • Keil uVision5 设置 hex 输出路径,不放Objects目录下
  • 垃圾收集器G1ZGC详解
  • 2025海丰杯WP
  • 油猴脚本(tampermonkey)离线安装文件下载,带油猴(tampermonkey)插件清单
  • react useEffect Hook讲解
  • SentinelOne与MITRE ATTCK企业版2025评估的深度解析
  • 详细介绍:Docker的介绍
  • gen-ui-python
  • SPI和普通设计模式区别
  • 2025国内裱纸机厂家最新推荐排行榜:聚焦智能高速与全自动机型,权威精选综合实力 TOP3 厂家
  • 【题解】P13345 [EGOI 2025] IMO
  • 2025电线电缆厂家最新权威推荐榜:聚焦电线电缆实力企业,覆盖多场景需求助力精准选购
  • 9.27课后作业
  • 调度算法,上古三算法
  • 2025 年电脑租赁公司最新推荐排行榜:深度解析 TOP3 优质租电脑公司,助企业个人租赁电脑选择指南
  • 完整教程:✨WPF编程基础【1.2】:XAML中的属性
  • 学位论文中 公式的插入,格式调整、编号以及引用
  • 2025 北京羊蝎子餐厅推荐排行榜:TOP3最新必吃榜单,聚焦朝阳昌平东城等区域,揭秘北京羊蝎子餐厅必吃的门店!
  • 复刻江协激光触发器
  • Eurocrypt 2021 s Accepted Papers
  • Linux云服务器如何手动配置DNS?
  • Python 输入、输出的用法
  • 第一章——概论 - AlgosEng
  • 劝娃妈和娃不要学老人坐姿有感:老人无奈才坐成那样的。。AI协助分析很到位
  • 使用JOL查看对象布局
  • 集训队互测投题——封印
  • 一天一款实用的AI工具,第4期,AI翻译成英语