私有容器镜像仓库部署与运维指南：从Docker Registry到高可用架构-编程实验室

1. 项目概述：一个面向开发者的私有容器镜像仓库

如果你在团队里负责过容器化应用的部署和维护，大概率遇到过这样的场景：从公共镜像仓库拉取镜像时，网络时好时坏，速度慢得像蜗牛；或者，团队内部开发了一个基础镜像，里面封装了公司特定的安全策略和依赖库，你既不想把它公开到 Docker Hub，又需要让所有开发、测试和运维环境的同事都能方便地使用。这时候，一个部署在自己服务器上的私有容器镜像仓库，就成了刚需。

sophymarine/openregistry这个项目，就是瞄准这个痛点而来的。简单来说，它是一个开源的、轻量级的私有容器镜像仓库实现。它的名字 “openregistry” 已经点明了核心：一个开放的、可自由部署的注册表服务。这个项目并非要做一个功能大而全的“巨无霸”，而是力求在满足核心的镜像推送、拉取、存储、权限控制等需求的基础上，做到易于部署、配置和管理。对于中小型团队、个人开发者，或者需要在隔离网络环境中（比如某些内部研发环境）构建容器化交付流程的场景，它提供了一个非常干净、可控的选择。

我自己在多个项目里都部署过私有仓库，从早期的 Docker Registry v2 原生部署，到后来集成 Harbor 这样的企业级方案。Harbor 功能确实强大，但有时候，对于一个小团队或者一个快速验证的项目来说，它的部署复杂度和资源消耗显得有些“重”。而直接使用官方的registry:2镜像，虽然轻量，但在用户管理、界面可视化、项目隔离等方面的功能又过于基础，需要自己额外做很多“胶水”工作。openregistry的出现，在我看来，是在“极简”和“全能”之间找到了一个不错的平衡点。它试图提供一个开箱即用、具备基本 Web 管理界面和访问控制的私有仓库方案，让开发者能更快地搭建起属于自己的镜像分发管道。

2. 核心架构与设计思路拆解

2.1 技术栈选型：为什么是 Go 和轻量级组件？

打开sophymarine/openregistry的代码仓库，你会发现它的后端主要用 Go 语言编写。这个选择非常务实。Go 语言以高效的并发处理、出色的网络性能以及编译为单一可执行文件的特性著称，非常适合开发这种需要高并发处理镜像上传/下载请求的网络服务。相比于用 Python 或 Java 实现，Go 程序在资源占用和运行时性能上通常更有优势，这对于一个期望保持轻量级的服务来说至关重要。

在前端方面，项目通常会选择一个现代、轻量的前端框架，比如 Vue.js 或 React，来构建管理界面。这个界面不会像 Harbor 那样功能庞杂，而是聚焦于核心操作：浏览仓库列表、查看镜像标签、监控存储空间使用情况，以及管理用户和访问权限。这种“够用就好”的设计哲学，减少了前端复杂度，也降低了用户的学习成本。

存储层是镜像仓库的核心。openregistry大概率会采用与 Docker 官方 Registry 兼容的存储驱动结构，将镜像的层（Layer）和清单（Manifest）以特定的目录结构存储在文件系统上。同时，为了支持分布式部署或云环境，它很可能会集成对多种后端存储的支持，比如本地文件系统、AWS S3、阿里云 OSS、MinIO 等对象存储。这种设计让用户可以根据自己的基础设施情况灵活选择，如果只是单机测试，用本地磁盘就行；如果是生产环境，挂载一个高可用的对象存储服务会更可靠。

2.2 核心功能模块解析

一个可用的私有镜像仓库，至少需要以下几个核心模块协同工作：

1. 认证与授权模块：这是私有仓库安全性的基石。openregistry必须实现一套认证机制。最简单的可能是 HTTP 基本认证（Basic Auth），配合一个配置文件或内置的轻量级数据库（如 SQLite）来管理用户名和密码。更常见的做法是支持基于令牌（Token）的认证，比如集成一个外部的 OAuth2 服务，或者实现与 Docker CLI 兼容的认证流程。当用户执行docker login your-registry.com时，仓库服务需要能够验证凭证并返回一个有效的令牌，后续的推送和拉取操作都基于这个令牌进行鉴权。

在授权方面，需要实现项目（或命名空间）级别的访问控制。例如，你可以创建一个名为backend的项目，只允许后端开发团队的成员推送镜像到your-registry.com/backend/路径下。而frontend项目的镜像，则对前端团队可见。这种基于项目的权限隔离，是团队协作的基本需求。

2. 镜像存储与分发模块：这是最核心的数据平面。它需要实现 Docker Registry HTTP API V2 规范。这个规范定义了客户端（如 Docker Daemon）与仓库服务之间通信的所有接口，包括：

GET /v2/：服务发现，检查仓库是否可用。
GET /v2/<name>/manifests/<reference>：获取镜像清单，清单里描述了镜像的配置和所有层的摘要（Digest）。
GET /v2/<name>/blobs/<digest>：下载具体的镜像层数据块（Blob）。
PUT /v2/<name>/manifests/<reference>：上传镜像清单。
PUT /v2/<name>/blobs/uploads/...：发起并完成镜像层的上传。

openregistry需要完整、高效地实现这些接口。其中，对于大文件（镜像层可能高达数GB）的上传，需要支持分块传输（Chunked Transfer），以应对网络不稳定和断点续传的需求。

3. 元数据管理与垃圾回收：镜像在仓库中并非只是一个简单的 tar 包。一个镜像可能被多个标签引用，多个镜像可能共享相同的层。仓库服务需要维护这些复杂的引用关系。当删除一个标签时，需要判断其底层的镜像层是否还被其他镜像引用，如果没有，才能安全地删除该层数据以释放空间。这个过程就是垃圾回收（Garbage Collection）。一个设计良好的垃圾回收机制，既能避免存储空间被无效数据占用，又要防止误删正在被使用的层。

4. Web 管理界面（UI）：这是提升易用性的关键。通过一个清晰的 Web 界面，管理员可以：

直观地查看所有项目及其下的镜像列表。
查看每个镜像的标签、创建时间、大小等信息。
删除不再需要的镜像或标签。
管理用户账户和权限。
查看系统的存储使用情况和基本运行状态。

这个界面通过调用仓库自身的 RESTful API 或直接查询后端数据库来获取数据。它的存在，让运维人员不必再频繁使用命令行工具来管理仓库，降低了操作门槛。

3. 部署与配置实操详解

3.1 环境准备与部署方式选择

假设我们准备在一台 Linux 服务器（如 Ubuntu 22.04）上部署openregistry。首先需要确保基础环境：

# 更新系统包 sudo apt-get update && sudo apt-get upgrade -y # 安装 Docker 和 Docker Compose (如果尚未安装) # 安装 Docker curl -fsSL https://get.docker.com -o get-docker.sh sudo sh get-docker.sh sudo usermod -aG docker $USER # 将当前用户加入docker组，避免每次sudo newgrp docker # 刷新组权限，或重新登录 # 安装 Docker Compose Plugin (V2) sudo apt-get install docker-compose-plugin -y # 验证安装 docker compose version

openregistry通常会提供多种部署方式，最常见的是 Docker Compose，因为它能一键拉起服务及其依赖（如数据库）。

步骤一：获取部署配置文件你需要从项目的 GitHub 仓库（sophymarine/openregistry）找到docker-compose.yml和相关的环境配置文件（如.env或config.yml）。

# 创建一个专用目录 mkdir -p /opt/openregistry && cd /opt/openregistry # 从项目仓库获取 docker-compose.yml 示例文件 # 这里假设你通过 git clone 或直接下载的方式获取 # 例如：wget https://raw.githubusercontent.com/sophymarine/openregistry/main/deploy/docker-compose.yml # 注意：实际URL需查看项目文档

步骤二：配置关键参数部署前，必须修改几个关键配置。我们以一个假设的docker-compose.yml和.env文件为例：

docker-compose.yml示例片段：

version: '3.8' services: registry: image: sophymarine/openregistry:latest # 或特定的版本标签 container_name: openregistry restart: unless-stopped ports: - "5000:5000" # 服务端口 environment: - REGISTRY_HTTP_HOST=https://registry.your-domain.com # 外部访问地址 - REGISTRY_AUTH_HTPASSWD_REALM=OpenRegistry Realm - REGISTRY_AUTH_HTPASSWD_PATH=/auth/htpasswd - REGISTRY_STORAGE_FILESYSTEM_ROOTDIRECTORY=/var/lib/registry - REGISTRY_LOG_LEVEL=info volumes: - ./data:/var/lib/registry # 镜像数据持久化 - ./auth:/auth # 认证文件持久化 - ./config.yml:/etc/docker/registry/config.yml # 自定义配置文件 networks: - registry-net ui: image: sophymarine/openregistry-ui:latest container_name: openregistry-ui restart: unless-stopped ports: - "8080:80" # 管理界面端口 environment: - REGISTRY_URL=http://registry:5000 # 指向后端仓库服务 - UI_TITLE=My Private Registry depends_on: - registry networks: - registry-net networks: registry-net: driver: bridge

.env文件（用于集中管理环境变量）：

# 域名和端口 REGISTRY_DOMAIN=registry.your-domain.com REGISTRY_PORT=5000 UI_PORT=8080 # 存储路径（相对于当前目录） REGISTRY_DATA_DIR=./data REGISTRY_AUTH_DIR=./auth # 初始管理员凭证（用于首次登录UI或创建用户） # 注意：这是示例，生产环境应用更安全的方式，如从外部Secret注入 ADMIN_USER=admin ADMIN_PASSWORD=ChangeMe123!

关键配置解析：

REGISTRY_HTTP_HOST：这是最重要的配置之一。必须设置为客户端（Docker 命令）访问仓库时使用的完整地址。如果打算用域名访问，这里就填https://registry.your-domain.com。它会影响仓库生成的镜像 URL。
存储卷映射：./data:/var/lib/registry和./auth:/auth是必须的。前者持久化所有镜像数据，后者持久化用户认证文件（如htpasswd）。务必确保宿主机目录存在且 Docker 进程有读写权限。
网络：为服务创建一个独立的 Docker 网络（registry-net），让ui容器能通过服务名registry访问后端，这是一种良好的隔离实践。

3.2 认证配置与首次启动

私有仓库必须配置认证。这里以最基本的htpasswd静态文件认证为例。

步骤一：创建认证文件在宿主机上，使用htpasswd工具（可通过apache2-utils包安装）创建用户。

# 安装 htpasswd 工具 sudo apt-get install apache2-utils -y # 在项目目录下创建 auth 目录 mkdir -p auth # 创建第一个用户（admin），-B 表示使用 bcrypt 加密，更安全 htpasswd -Bc auth/htpasswd admin # 系统会提示输入并确认密码，例如输入：ChangeMe123! # 添加第二个用户（developer） htpasswd -B auth/htpasswd developer # 输入密码

现在auth/htpasswd文件里就保存了加密后的用户凭证。

步骤二：启动服务

# 在包含 docker-compose.yml 的目录下执行 docker compose up -d

使用-d参数让服务在后台运行。用docker compose logs -f registry可以查看后端服务的实时日志，检查是否有错误。

步骤三：配置域名与 TLS/SSL（生产环境必须）对于生产环境，必须使用 HTTPS。有两种常见方式：

反向代理（推荐）：使用 Nginx 或 Traefik 作为反向代理，负责 TLS 终止、负载均衡和域名路由。你可以在 Nginx 配置中设置 SSL 证书（来自 Let‘s Encrypt 或购买的证书）。

# Nginx 配置示例片段 (registry.conf) server { listen 443 ssl http2; server_name registry.your-domain.com; ssl_certificate /path/to/fullchain.pem; ssl_certificate_key /path/to/privkey.pem; location / { proxy_pass http://localhost:5000; # 指向本机运行的 openregistry 服务端口 proxy_set_header Host $host; proxy_set_header X-Real-IP $remote_addr; proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for; proxy_set_header X-Forwarded-Proto $scheme; # 如果镜像层很大，可能需要调整超时和缓冲区 client_max_body_size 0; proxy_read_timeout 900; } }

配置好后，重启 Nginx。此时，REGISTRY_HTTP_HOST就应该设置为https://registry.your-domain.com。

仓库服务自带 TLS：在openregistry的配置文件中直接配置证书路径。这种方式通常更复杂，且不利于在仓库前部署其他中间件。

注意：Docker 守护进程默认认为localhost和127.0.0.1是安全域，访问它们不需要 HTTPS。但一旦使用域名或 IP 地址，Docker 就会强制要求使用 HTTPS，除非你明确将其添加到 Docker 守护进程的insecure-registries配置中（仅限测试环境）。生产环境绝不建议使用非安全注册表。

步骤四：客户端 Docker 配置与登录在需要推送/拉取镜像的机器上，配置 Docker 客户端。

# 1. 如果使用自签名证书或非安全仓库（测试），需修改 Docker 守护进程配置 # 编辑 /etc/docker/daemon.json (如果不存在则创建) # 添加以下内容，将你的仓库域名或IP加入不安全列表（不推荐生产使用） { "insecure-registries": ["registry.your-domain.com:5000"] } # 然后重启 Docker 服务：sudo systemctl restart docker # 2. 登录到私有仓库（推荐使用HTTPS和有效证书，无需上一步） docker login registry.your-domain.com # 输入之前在 htpasswd 中设置的用户名和密码 # 登录成功后，凭证会保存在 ~/.docker/config.json 中

4. 日常使用、运维与问题排查

4.1 镜像推送与拉取实战

假设我们有一个简单的 Web 应用，已经构建成镜像my-web-app:1.0.0。

步骤一：标记镜像在推送之前，需要按照私有仓库的地址规则重新标记（Tag）本地镜像。

# 查看本地镜像 docker images my-web-app # 重新标记，格式为：<registry-host>[:port]/<project-name>/<image-name>:<tag> docker tag my-web-app:1.0.0 registry.your-domain.com/myproject/my-web-app:1.0.0 # 如果仓库有端口，如 5000，则应为 registry.your-domain.com:5000/...

这里的myproject相当于一个命名空间或项目名，用于在仓库内逻辑隔离镜像。如果myproject不存在，在首次推送时仓库会自动创建（取决于权限设置）。

步骤二：推送镜像

docker push registry.your-domain.com/myproject/my-web-app:1.0.0

你会看到输出开始上传镜像的各个层（Layer）。这个过程的速度取决于你的网络带宽和镜像层的大小。如果层已经存在于仓库中（基于内容摘要判断），则会跳过上传，显示Layer already exists。

步骤三：从其他机器拉取镜像在另一台已经登录过该私有仓库的机器上，直接执行拉取命令：

docker pull registry.your-domain.com/myproject/my-web-app:1.0.0

步骤四：通过 Web UI 管理打开浏览器，访问http://your-server-ip:8080（或你配置的 UI 域名），使用管理员账号登录。你应该能看到一个名为myproject的项目，点进去可以看到my-web-app镜像及其1.0.0标签。在这里，你可以删除旧的标签、查看镜像大小等信息。

4.2 运维管理：存储清理与垃圾回收

私有仓库运行一段时间后，存储空间会逐渐被占满。频繁的构建和推送会产生很多中间镜像和悬空（Dangling）层。openregistry需要提供清理机制。

1. 手动删除镜像标签：这是最直接的方式，通过 Web UI 或 API 删除不需要的标签。但请注意，删除标签并不立即释放物理空间，因为底层的数据层可能还被其他镜像引用。只有当一个数据层不再被任何镜像清单引用时，它才会成为“垃圾”。

2. 执行垃圾回收（GC）：垃圾回收才是真正释放磁盘空间的操作。openregistry应该提供一个管理命令或 API 来触发 GC。

# 假设 openregistry 提供了命令行工具或可以通过 exec 进入容器执行 # 方式一：如果服务提供了 gc 子命令 docker compose exec registry openregistry garbage-collect --dry-run # --dry-run 参数先模拟运行，查看哪些内容会被删除，但不实际执行 docker compose exec registry openregistry garbage-collect # 实际执行垃圾回收 # 方式二：如果 GC 是通过 API 触发的 curl -X POST -u admin:password http://localhost:5000/api/v2/_gc

垃圾回收是一个高风险操作，因为它会永久删除数据。务必注意：

在业务低峰期进行：GC 过程可能会占用大量 I/O 和 CPU，并可能短暂影响推送/拉取性能。
先做 Dry-Run：一定要先模拟运行，确认要删除的内容是预期的。
做好备份：在执行 GC 前，确保有完整的备份策略。虽然镜像层是内容寻址的，理论上可以从其他仓库恢复，但备份仍是好习惯。
理解删除策略：有些仓库支持配置 GC 策略，比如只删除超过30天的未引用层。了解你所用版本的策略。

3. 监控存储使用：定期通过 Web UI 或检查宿主机磁盘使用情况（df -h查看挂载卷）来监控仓库的存储空间。设置磁盘使用率告警（例如超过80%），以便及时介入清理。

4.3 常见问题与排查技巧实录

在实际运维中，你肯定会遇到各种问题。下面是一些典型场景和排查思路。

问题一：docker push失败，报错denied: requested access to the resource is denied或unauthorized: authentication required。

可能原因 1：未登录或登录凭证失效。
- 排查：运行docker logout registry.your-domain.com然后重新docker login。检查~/.docker/config.json文件，看对应仓库的认证信息是否存在且正确。
- 解决：重新登录。确保输入的用户名和密码与仓库htpasswd文件或用户数据库中的一致。
可能原因 2：用户权限不足。
- 排查：该用户可能没有对目标项目（如myproject）的推送（push）权限。
- 解决：使用管理员账号登录 Web UI，在项目权限设置中，为该用户添加“开发者”或“维护者”角色（具体角色名因项目实现而异）。
可能原因 3：仓库服务认证配置错误。
- 排查：查看仓库容器的日志docker compose logs registry，看是否有认证相关的错误，比如htpasswd文件路径错误、格式不支持等。
- 解决：检查docker-compose.yml中REGISTRY_AUTH_HTPASSWD_PATH的环境变量和卷映射是否正确。确认htpasswd文件是用-B(bcrypt) 参数创建的，旧的crypt格式可能不被支持。

问题二：docker pull速度非常慢。

可能原因 1：网络问题。客户端与仓库服务器之间的网络延迟高或带宽小。
- 排查：在客户端使用ping和traceroute测试网络连通性和延迟。
- 解决：考虑将仓库部署在离客户端更近的网络区域，或者优化网络路由。对于跨地域团队，可以在多个地区部署仓库实例，并利用同步工具进行镜像复制。
可能原因 2：仓库服务器磁盘 I/O 瓶颈。
- 排查：登录仓库服务器，使用iostat或iotop命令查看磁盘利用率。在 GC 或大量推送/拉取时，I/O 可能成为瓶颈。
- 解决：为仓库数据目录使用高性能的 SSD 磁盘。如果使用云服务，选择高 IOPS 的云盘。
可能原因 3：镜像层太大，且未使用分块传输优化。
- 排查：这个问题更多是客户端感知。确保 Docker 客户端和仓库服务都支持 HTTP/2 和分块传输。
- 解决：通常由仓库服务端配置和网络中间件（如 Nginx）共同支持。确保 Nginx 配置中client_max_body_size设置为0（不限制），并配置了合理的缓冲和超时时间。

问题三：Web UI 无法访问或显示异常。

可能原因 1：UI 服务未启动或端口冲突。
- 排查：运行docker compose ps检查openregistry-ui容器状态是否为Up。运行netstat -tlnp | grep :8080检查8080端口是否被其他进程占用。
- 解决：重启 UI 服务docker compose restart ui。如果端口冲突，修改docker-compose.yml中的端口映射，例如改为"8081:80"。
可能原因 2：UI 无法连接到后端 Registry 服务。
- 排查：查看 UI 容器的日志docker compose logs ui，通常会有连接失败的报错。检查docker-compose.yml中 UI 服务的环境变量REGISTRY_URL是否正确（应为http://registry:5000，使用 Docker Compose 服务名）。
- 解决：确保registry服务正常运行，并且 UI 和 registry 服务在同一个 Docker 网络（registry-net）中。

问题四：磁盘空间不足，但通过 UI 删除镜像后空间未释放。

可能原因：只删除了标签，未进行垃圾回收。
- 排查：这是最常见的原因。删除操作只是删除了镜像的“标签”（即 Manifest 的引用），底层的数据层（Blob）仍然存在。
- 解决：按照上文“垃圾回收”部分的步骤，执行垃圾回收任务。再次强调，先做 Dry-Run！

问题五：推送镜像时，在某个层卡住很久，最后超时。

可能原因 1：网络不稳定或层文件太大。
- 排查：观察日志，看是在哪个层的摘要（Digest）处卡住。尝试推送一个非常小的镜像（如alpine:latest）测试是否是网络通性问题。
- 解决：优化网络环境。对于超大镜像，考虑优化 Dockerfile，使用多阶段构建减少最终镜像大小，或者拆分应用。
可能原因 2：反向代理（如 Nginx）配置了不合理的超时时间。
- 排查：检查 Nginx 的proxy_read_timeout和proxy_send_timeout配置，对于 GB 级别的镜像推送，可能需要设置为900s（15分钟）或更高。
- 解决：调整 Nginx 配置，增加超时时间，并设置client_max_body_size 0;。

实操心得：维护私有仓库，日志是你的第一道防线。养成遇到问题先看相关容器日志的习惯。docker compose logs -f [service_name]可以实时跟踪日志。另外，对于生产环境，强烈建议将仓库的访问日志、错误日志收集到统一的日志平台（如 ELK Stack），便于分析和审计。

5. 进阶配置与高可用考量

当你的团队规模扩大，或者对服务的可靠性要求提高时，基础的单机部署可能就不够用了。openregistry作为一个开源项目，其设计应该允许进行一些进阶配置。

5.1 使用外部存储与数据库

1. 配置对象存储（如 AWS S3, MinIO）：对于生产环境，将镜像数据存储在本地磁盘风险较高（磁盘损坏、容量限制）。使用云对象存储或自建的对象存储（如 MinIO）是更可靠、可扩展的选择。你需要修改仓库的配置文件（例如config.yml）：

# config.yml 片段 storage: s3: accesskey: YOUR_ACCESS_KEY secretkey: YOUR_SECRET_KEY region: us-east-1 bucket: my-registry-bucket # 可选：指定存储路径前缀 rootdirectory: /docker/registry # 对于非AWS S3端点（如MinIO） regionendpoint: http://minio.example.com:9000 encrypt: false secure: false # 如果端点使用HTTP而非HTTPS

然后，在docker-compose.yml中，将包含此配置的config.yml文件挂载到容器的对应路径。务必确保密钥等敏感信息通过环境变量或 Docker Secret 注入，而不是硬编码在配置文件里。

2. 使用外部数据库管理元数据：默认情况下，openregistry可能使用 SQLite 或内置的内存数据库来管理用户、项目等元数据。这对于单机测试没问题，但在多实例部署或需要更好性能时，就需要外部的 PostgreSQL 或 MySQL 数据库。

# docker-compose.yml 中增加数据库服务 services: db: image: postgres:15-alpine container_name: registry-db restart: unless-stopped environment: POSTGRES_DB: registry POSTGRES_USER: registryuser POSTGRES_PASSWORD: strongpassword volumes: - ./pgdata:/var/lib/postgresql/data networks: - registry-net registry: ... environment: - DATABASE_URL=postgres://registryuser:strongpassword@db:5432/registry # 其他配置... depends_on: - db

同时，需要在仓库的配置文件中指定使用数据库驱动来存储元数据。

5.2 向高可用架构演进

真正的生产级私有仓库需要高可用（HA），避免单点故障。这通常不是一个简单的配置能搞定，而是一套架构设计。

思路一：无状态服务层 + 共享存储和数据库这是实现高可用的经典模式。

多个openregistry实例：在负载均衡器（如 Nginx, HAProxy, 或云负载均衡器）后面部署两个或多个openregistry容器实例。这些实例本身是无状态的（不存储数据）。
共享存储：所有实例配置为使用同一个外部存储后端，如 AWS S3、Ceph 或一个高可用的 NFS/GlusterFS 集群。这样，任何一个实例都能读写所有的镜像数据。
共享数据库：所有实例连接同一个外部的、高可用的 PostgreSQL 集群（如 Patroni + PostgreSQL），用于管理用户、项目权限等元数据。
负载均衡器：负责将客户端的请求分发到不同的openregistry实例。需要配置会话保持（Session Affinity）吗？对于 Docker Registry API，大部分请求是独立的，不需要严格的会话保持，但上传大 Blob 时的分块上传请求需要路由到同一个后端实例，这需要负载均衡器支持相应的机制（如基于Docker-Upload-UUID头部的哈希）。

思路二：主动-被动模式这种模式相对简单。部署两套完整的openregistry环境（A 和 B），共享存储和数据库。平时所有流量走 A（主动）。通过监控检测 A 是否健康，一旦 A 故障，通过 DNS 切换或负载均衡器配置将流量切到 B（被动）。这种模式有切换时间，但架构简单。

注意事项：实现高可用时，缓存是一个需要特别小心的地方。如果openregistry实例在内存或本地磁盘缓存了镜像清单或层信息，在多个实例间就需要考虑缓存一致性问题。通常，对于镜像仓库这种读多写少、数据强一致要求高的场景，会倾向于禁用缓存或使用分布式的缓存方案（如 Redis）。在部署前，需要仔细阅读openregistry关于缓存和集群模式的文档。

6. 安全加固实践

私有仓库存放着团队的核心资产——应用镜像，安全不容忽视。

1. 强制使用 HTTPS：这是底线。绝不在生产环境使用insecure-registry。使用有效的、受信任的 SSL/TLS 证书（Let‘s Encrypt 免费且自动续期）。

2. 细粒度的访问控制：

基于角色的访问控制（RBAC）：充分利用项目的用户/权限管理系统。创建不同的角色，如“访客”（只读）、“开发者”（读写）、“维护者”（读写+删除）、“管理员”（全权限）。
最小权限原则：只为用户分配完成工作所必需的最小权限。例如，测试人员可能只需要“访客”角色拉取镜像，而不需要推送权限。

3. 镜像安全扫描（如果项目集成或支持）：这是企业级仓库的重要功能。虽然openregistry核心可能不包含，但可以关注它是否支持与 Clair、Trivy 等开源漏洞扫描工具集成。流程通常是：推送镜像后，自动触发扫描，将扫描结果与镜像关联，并在 UI 中展示风险等级，甚至阻止高危镜像的拉取。

4. 审计日志：确保所有操作（登录、推送、拉取、删除）都被完整记录。检查openregistry的日志输出格式，并将其接入公司的 SIEM（安全信息和事件管理）系统，便于追溯和安全分析。

5. 网络隔离：将私有仓库部署在内网，通过 VPN 或跳板机访问，而不是直接暴露在公网。如果必须提供公网访问，则严格限制访问来源 IP（通过负载均衡器或防火墙策略）。

6. 定期更新与漏洞监控：关注sophymarine/openregistry项目的安全更新和发布。像所有开源软件一样，及时更新到新版本以修复已知安全漏洞。订阅项目的 GitHub 发布页或安全公告。

部署和维护一个私有容器镜像仓库，就像维护一个数字化的“零件库”。sophymarine/openregistry这类项目，为不想被公有云绑定、注重数据主权和定制化需求的团队提供了一个可行的自建方案。从单机部署到高可用架构，从基础推拉到安全加固，每一步都需要根据团队的实际规模和需求来权衡。我的经验是，起步时越简单越好，快速跑通流程；随着业务增长，再逐步引入更复杂的架构和更严格的安全策略。最关键的是，要把镜像仓库视为核心基础设施的一部分，给予它应有的关注和运维投入。