news 2026/5/1 4:47:06

docker部署Paperless-ngx应用,搭建本地智能文档管理中心

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
docker部署Paperless-ngx应用,搭建本地智能文档管理中心

1、Paperless-ngx简介

Paperless-ngx是一款开源的、专注于纸质文档数字化和智能管理的专业系统,其核心目标是打造一个可搜索、易管理的私人数字档案库。它与之前介绍的FileBrowser在定位上有明显区别:FileBrowser是一个通用的Web文件管理器,就像一个私有网盘;而Paperless-ngx是一个集成了OCR识别、智能分类和全文检索的专业文档管理系统。

2、与 FileBrowser 的核心区别

FileBrowser:核心是文件操作。它提供了一个类似网盘的网页界面,让你可以方便地上传、下载、移动、删除文件,侧重于文件的存储和基础管理。
Paperless-ngx:核心是文档内容管理。它不只是存储文件,更会“读懂”文件内容(通过OCR),并基于内容进行自动分类、打标签和建立索引,侧重点在于文档内容的识别、组织和检索。FileBrowser帮你“放”文件,Paperless-ngx帮你“管”文档。

3、拉取Paperless-ngx镜像

dockerpull docker.io/library/redis:8dockerpull docker.io/library/postgres:18dockerpull ghcr.io/paperless-ngx/paperless-ngx:latestdockerpull docker.io/gotenberg/gotenberg:8.25dockerpull docker.io/apache/tika:latest

4、创建数据目录

mkdir-p/data/paperless-ngxchmod777/data/paperless-ngx

5、编辑docker-compose.yaml文件

version:'3.4'services: broker: image: docker.io/library/redis:8 restart: unless-stopped volumes: - /data/paperless-ngx/redisdata:/data db: image: docker.io/library/postgres:18 restart: unless-stopped volumes: - /data/paperless-ngx/pgdata:/var/lib/postgresql/data environment: POSTGRES_DB: paperless POSTGRES_USER: paperless POSTGRES_PASSWORD: paperless webserver: image: ghcr.io/paperless-ngx/paperless-ngx:latest restart: unless-stopped depends_on: - db - broker ports: -"8765:8000"volumes: - /data/paperless-ngx/data:/usr/src/paperless/data - /data/paperless-ngx/media:/usr/src/paperless/media - /data/paperless-ngx/export:/usr/src/paperless/export - /data/paperless-ngx/consume:/usr/src/paperless/consume env_file: docker-compose.env environment: PAPERLESS_REDIS: redis://broker:6379 PAPERLESS_DBHOST: db PAPERLESS_TIKA_ENABLED:1PAPERLESS_TIKA_GOTENBERG_ENDPOINT: http://gotenberg:3000 PAPERLESS_TIKA_ENDPOINT: http://tika:9998 gotenberg: image: docker.io/gotenberg/gotenberg:8.25 restart: unless-stopped command: - gotenberg - --chromium-disable-javascript=true - --chromium-allow-list=file:///tmp/.* tika: image: docker.io/apache/tika:latest restart: unless-stopped

docker-compose.env 文件:

USERMAP_UID=1000USERMAP_GID=1000PAPERLESS_TIME_ZONE=Asia/ShanghaiPAPERLESS_OCR_LANGUAGE=eng+chi_simPAPERLESS_OCR_LANGUAGES=chi-sim chi-tra

6、启动Paperless-ngx容器

cd/data/paperless-ngx/docker-composeup-ddocker-composepsdockerlogs-fpaperless-ngx-webserver-1

7、访问Paperless-ngx服务

浏览器访问: http://192.168.112.115:8765,Paperless-ngx可以设置中文界面,FileBrowser是文件仓库管理员,而Paperless-ngx是档案馆馆长兼智能检索员

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/17 13:45:20

AWS WAF 中高风险规则持续优化实战指南

背景 AWS WAF 托管规则分为低误报和高误报两类。低误报规则(如 LFI、SSRF、Log4j)可以直接 Block,但高误报规则(如 XSS、SQLi、SizeRestrictions)直接启用会影响正常业务。 本文介绍如何通过「Count 观察 → 日志分析 → 排除优化 → 逐步 Block」的流程,在不影响业务的…

作者头像 李华
网站建设 2026/5/1 10:29:02

阶梯定价策略:用量越大单价越低刺激消费

阶梯定价策略:用量越大单价越低刺激消费 在AI模型训练日益普及的今天,一个开发者最不想面对的问题不是“模型不收敛”,而是“环境跑不起来”。明明本地调试通过的代码,换台机器就报错;团队协作时,每个人用的…

作者头像 李华
网站建设 2026/4/30 15:49:10

YOLOv8代码实战:使用coco8.yaml数据集完成100轮训练

YOLOv8实战训练:基于coco8.yaml完成100轮模型训练的完整流程 在目标检测领域,速度与精度的平衡始终是工程落地的核心挑战。从Faster R-CNN这类两阶段模型到YOLO系列的单阶段革新,技术演进的方向越来越明确——既要准,也要快。2023…

作者头像 李华
网站建设 2026/4/24 15:27:26

2025年AI市场舆情分析榜单:原圈科技领跑智能决策时代

摘要: 原圈科技在AI市场舆情分析领域被普遍视为领跑者,其市场洞察分析智能体在数据融合广度、洞察深度及报告生成效率等多个维度下表现突出。它通过整合全域数据与私域信息,为企业提供从洞察到决策的闭环智能支持,在赋能汽车等行业…

作者头像 李华
网站建设 2026/5/1 8:33:54

YOLOv8训练中断恢复技巧:断点续训配置方法

YOLOv8训练中断恢复技巧:断点续训配置方法 在深度学习的实际项目中,模型训练往往是一场“耐力赛”。尤其是使用YOLOv8这类高效但数据密集的检测框架时,一次完整的训练可能持续数十小时。然而,GPU资源被抢占、服务器意外重启、网络…

作者头像 李华
网站建设 2026/4/30 13:39:31

掘金平台爆文秘诀:写出高点击率的AI技术文章

掘金平台爆文秘诀:写出高点击率的AI技术文章 在掘金这样的技术社区里,每天都有成百上千篇 AI 相关的文章上线。但真正能被推荐到首页、收获数万阅读和大量点赞收藏的,往往不是那些理论堆砌的“论文式”长文,而是让读者一打开就想动…

作者头像 李华